搜索爬虫允许您在没有开发人员资源的情况下在帮助中心实现联邦搜索。亚博电脑端您可以在帮助中心设置多个抓取工具,以便在相同或不同网站中抓取和索引不同的内容。看到关于Zend亚博esk Federated Search.
注意:您有责任在遵守所有适用法律和相关网站的条款和条件的情况下使用帮助中心搜索爬虫。您应该只添加您拥有与此类站点地图相关联的域的站点地图。通过使用帮助中心搜索爬虫,您确认您拥有添加到爬虫中的所有Sitemaps的域名,并且您有权抓取此类网站。
设置搜索爬虫
在指南中,单击设置图标(),然后单击搜索设置.
- 下爬虫,点击管理.
- 点击添加履带.
- 在命名这个爬虫,配置如下内容:
- 名字—输入要分配给爬虫的名称。这是一个内部名称,用于在爬虫管理列表中标识您的搜索爬虫。
- 老板—输入负责爬虫维护和故障处理的Guide admin用户的名称。默认情况下,爬虫所有者是创建爬虫的用户,但是您可以将此名称更改为任何Guide管理员。
当爬虫成功运行时,以及出现错误通知(例如域验证、处理站点地图或抓取页面的问题)时,爬虫所有者都会收到电子邮件通知。看到搜索爬虫故障排除.
- 在添加你想要抓取的网站,通过配置以下内容来验证域的所有权:
- 网站网址—输入需要抓取的网站URL。
- 域所有权验证——点击复制将HTML标记复制到剪贴板上,然后将该标记粘贴到站点未经身份验证的主页的HTML代码中的部分。您可以在完成爬虫设置之后这样做,并且您总是可以在编辑爬虫页面上找到验证标记。看到管理搜索爬虫.注意:一旦标记到位,就不要删除它,因为爬虫每次运行时都需要完成成功的域验证。
- 在添加站点地图,在网站地图的URL,输入您希望爬虫在抓取您的站点时使用的站点地图的URL。站点地图必须遵循sitemaps XML协议并包含您想要抓取的站点内所有页面的列表。站点地图可以是包含站点所有页面的标准站点地图,也可以是列出您希望爬虫抓取的页面的专用站点地图。所有站点地图必须托管在爬虫配置为爬行的域上。您可以在同一个站点上设置多个爬虫,每个爬虫使用不同的站点地图来定义您希望搜索爬虫抓取的页面。注意:搜索爬虫不支持站点地图索引。站点地图是一个文件,它列出了您想要索引的每个页面的url,站点地图索引是一个文件,它列出了各个站点地图的url。
- 在添加过滤器来帮助人们找到这些内容,配置源过滤器和类型过滤器用于过滤最终用户的搜索结果。来源是指外部内容的来源,例如论坛、问题跟踪器或学习管理系统。类型指的是内容的类型,例如博客文章、技术说明或bug报告。
- 源—单击箭头,然后从列表中选择源或选择+创建新源添加描述此内容所在位置的名称。
- 类型-单击箭头,然后从列表中选择类型或选择+创建新类型添加一个名称来描述这是什么类型的内容。
注意:要编辑或删除在搜索爬虫设置期间创建的源和类型,请参见管理搜索过滤器. - 点击完成.搜索爬虫已经创建并挂起。在24小时内,爬虫将验证域名的所有权,然后获取并解析指定的站点地图。一旦站点地图处理成功,爬虫程序就开始抓取页面并为其内容建立索引。如果爬虫在域验证期间或在处理站点地图时失败,爬虫所有者将收到一封电子邮件通知,其中包含故障排除提示,以帮助解决问题。爬虫会在24小时内再试一次。看到搜索爬虫的故障排除.注意:亚博Zendesk/External-Content是搜索爬虫的用户代理。要防止爬虫程序由于防火墙阻止请求而失败,请将其列入白名单(或允许列表)亚博Zendesk /外部内容.
- 为联邦搜索设置帮助中心主题。
要使外部内容显示在帮助中心搜索的搜索结果中,您必须有一个支持联邦搜索结果的主题。为此,请使用最新版本的Copenhagen主题,或者将旧的{{help_center_filters}}和{{filters}} helper替换为新的{{source_filters}}和{{type_filters}}帮助者(见帮助中心模板烹饪书).
选择要在帮助中心搜索结果中包含和排除的内容。看到在帮助中心搜索结果中包含外部内容。
如果需要,可以将Knowledge结果配置为在Knowledge搜索中包含外部内容。看到在Zendesk Agent工作区中配置上下文面板亚博.
12个评论
证据确凿的内容
你好,你知道搜索爬虫是否可以用来索引Jira Confluence网站的内容吗?非常感谢!
你好,朱利安,
是的!爬虫可以用来索引内容从您的合流网站。如果您在设置时遇到问题,请直接与我们联系支持.
嘿SERVILLAT朱利安你把这个设置好了吗?
@……我们被告知这是不可能的,所以我得到了相互矛盾的信息……
你好马特Farrington-Smith是的,我们成功地用Confluence设置了爬虫。文章的索引工作,我们刚刚完成主题的升级,以包含正确的占位符,以返回联邦搜索的结果。
你好,在搜索之后,爬虫的内容是嵌入的还是只是一个弹出窗口或标签到外部内容的链接?
我问这个问题是因为我想知道在s3桶中托管HTML内容是否有意义,没有自定义域。如果爬虫嵌入内容,没有自定义域也没关系。这和弹出来的情况不同。
我怀疑不使用自定义域可能会产生像域验证规则这样的问题。
我希望我的问题是有意义的!
当用户执行搜索时,爬虫发现的相关外部内容将被排序并显示在搜索结果页面上,用户可以对结果进行过滤,并单击链接在另一个浏览器选项卡中查看外部内容链接。
有关更多信息,请参见关于Zend亚博esk Federated Search
你好,
我们有在MS Sharepoint上部署搜索爬虫的指南吗?
你好,是否将抓取的外部可见设置为“所有人”?有没有办法控制抓取的外部内容的可见性设置?
对于我们的一个用例,我们希望将抓取的外部内容限制为代理和管理员,但基于设置中可用的内容,我认为这是不可能的。
我有困难获得外部内容显示在搜索结果的每个人。我已经启用了它,并验证了爬虫正在工作。我错过什么了吗?
在配置爬虫时,如果在指定站点的同时包含子域,那么爬虫将覆盖整个域还是仅覆盖子域?
爬虫的验证标记是跨爬虫持久存在的,还是为每个爬虫生成一个新的验证标记?例如,如果我开始配置爬虫,复制标签,但不保存爬虫,因为我没有sitemap URL,当我回去完成创建爬虫时,该标签是否相同?
这对每个人都是可见的,并且不可能像限制帮助中心文章的用户段一样限制它。
嗨生产厂,
对于您将为爬虫指定的每个域,它将具有不同的验证标记。如果您要为已经验证过的同一域创建另一个爬虫,情况也是如此。
请登录留下评论。