区域设置是一种标准,它指定帮助中心内容使用的语言,也可能是该语言的区域变体(例如,美式英语使用en-US,英式英语使用en-GB)。如果你配置帮助中心以支持多种语言,你可以本地化你的帮助中心添加内容的翻译版本,或仅添加特定语言的内容。
搜索爬虫在索引内容时确定外部内容的区域设置和语言,从而使其能够映射到对应于该区域设置的帮助中心。
本文包含以下部分:
帮助中心的区域设置
帮助中心根据页面URL中的语言环境代码(例如,"…/hc/en-us")显示不同语言的页面。任何翻译的文章也必须有父页(节和类别)翻译在同一种语言。
下图说明了用于指定内容的语言和区域变化的区域设置标记。此标记出现在帮助中心中每篇文章的文章URL中(例如,https://helpcenter.zendesk.com/hc/)亚博en - us /文章/ 4408827609882)。
搜索爬虫如何检测地区
搜索爬虫有助于帮助中心处理多种语言和区域设置,方法是确定外部内容的区域设置和语言(包括区域变化),然后用检测到的区域设置对内容进行索引,以便将其映射到相应的帮助中心。
要确定区域设置或语言,搜索爬虫首先尝试从对象中提取区域设置朗
属性中的< html >
标记,以确定在帐户上的任何帮助中心中是否存在与区域设置完全匹配的内容。如果存在匹配,则使用检测到的区域设置对记录进行索引。如果没有检测到区域设置,或者没有精确匹配,则爬行程序将尝试从列表中提取该区域设置内容语言头
,然后是< meta >
标签。
如果没有完全匹配的朗
,内容语言头
或元
标记时,爬虫会尝试查找与语言子标记匹配的帮助中心区域设置html朗
(区域部分在朗
标记(如果存在则忽略)。例如,对于带有的页面< html lang =“en”>
,如果帐户启用了美式英语(en-us)和英式英语(en-gb),则将为美式英语和英式英语区域设置对记录进行索引。
如果没有朗
,内容语言头
,或< meta >
标记定义后,爬虫使用紧凑语言检测(Compact Language Detection, CLD)对内容执行文本分析以检测语言。如果检测到某种语言,则使用与该语言匹配的启用区域设置对记录进行索引。例如,如果检测到英语(en),并且帐户启用了美式英语(en- US)和英式英语(en-gb),则将为美式英语和英式英语区域设置对记录进行索引。
如果没有检测到区域设置,或者检测到的区域设置与您帐户中的任何帮助中心翻译之间没有匹配,则爬虫会生成“未检测到区域设置”错误,该错误包含在发送给爬虫所有者的错误报告中搜索爬虫设置.
0评论
请登录留下评论。