未在SiteCore Lucene搜索索引中建立索引的组件 [英] Components not indexed in sitecore lucene search indexes

查看:81
本文介绍了未在SiteCore Lucene搜索索引中建立索引的组件的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我已经在配置&中配置了lucene搜索索引使用 lukeall 工具测试索引,它会搜索已定义模板的所有字段,但是页面上的内容正在使用另一个外部组件,该组件不会被搜索,但是可以搜索页面上的字段中的数据. 有什么办法可以像html search一样搜索它,以便可以对页面上的所有数据进行索引.

I have configured lucene search index in configuration & tested index with lukeall tool it searches for all fields of defined templates but content on pages are using another external component, which is not searched but data in fields of page are searchable. is there any way to search it something like html search so that all data on page could be indexed.

谢谢大家.

推荐答案

这是常见的要求.

此截屏视频概述了爬虫在页面的每个组件中循环(大约38分钟)的一种方法.

This screencast outlines an approach where the crawler loops through each of the page's components (at about 38 minutes in).

http://www.techphoria414.com/Blog/2012/May/Sitecore_Page_Editor_Unleashed

上面的示例使用了旧的Advanced Database Crawler,但是原理是合理的.

The above example uses the old Advanced Database Crawler, but the principle is sound.

另一种常见方法是在索引中创建一个计算字段,该字段使应用程序请求该页面,因此可以抓取其HTML.

Another common approach is to create a computed field in your index which causes the application to request to the page, so it's HTML can be scraped.

https://github.com/hermanussen/sitecore-html-crawler

我的偏好是第二个选择,因为它更准确

My preference is the second option because it's more accurate

这篇关于未在SiteCore Lucene搜索索引中建立索引的组件的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆