Sitecore 7 pdf索引 [英] Sitecore 7 pdf indexing
本文介绍了Sitecore 7 pdf索引的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我尝试使用Sitecore 7为PDF文件建立索引。 我安装了IFilter,但在爬网程序日志中收到下一个错误:
ManagedPoolThread #17 09:24:20 WARN LuceneIndexOperations : Update : Could not build document data 4433434-3443-3223-91c4-233232. Skipping.
Exception: System.Runtime.InteropServices.COMException
Message: Error HRESULT E_FAIL has been returned from a call to a COM component.
Source: mscorlib
at System.Runtime.InteropServices.ComTypes.IPersistFile.Load(String pszFileName, Int32 dwMode)
at Sitecore.ContentSearch.Extracters.IFilterTextExtraction.FilterLoader.LoadAndInitIFilter(String fileName, String extension)
at Sitecore.ContentSearch.Extracters.IFilterTextExtraction.FilterReader..ctor(String fileName)
at Sitecore.ContentSearch.ComputedFields.MediaItemIFilterTextExtractor.ComputeFieldValue(IIndexable indexable)
at Sitecore.ContentSearch.ComputedFields.MediaItemContentExtractor.ComputeFieldValue(IIndexable indexable)
at Sitecore.ContentSearch.LuceneProvider.LuceneDocumentBuilder.AddComputedIndexFields()
at Sitecore.ContentSearch.LuceneProvider.LuceneIndexOperations.GetIndexData(IIndexable indexable, IIndexable latestVersion, IProviderUpdateContext context)
at Sitecore.ContentSearch.LuceneProvider.LuceneIndexOperations.BuildDataToIndex(IProviderUpdateContext context, IIndexable version, IIndexable latestVersion)
at Sitecore.ContentSearch.LuceneProvider.LuceneIndexOperations.<>c__DisplayClass7.<Update>b__0(Item version)
我必须做的工作,因为在Sitecore文档中,他们说必须开箱即用。
推荐答案
我遇到了同样的问题,我收到了Sitecore支持人员的下一个响应(之后工作正常):
1)将所有Adobe iFilter.dll文件复制到"System32Inetsrv"文件夹。这是Windows Server上的IIS的工作目录。 默认情况下,Adobe iFilter.dll文件存储在"C:Program FilesAdobe PDF iFilter 9 for 64-bit Platform Sin"文件夹中。 您还可以使用"IFilter Explorer"工具检测存储.dll文件的文件夹: http://www.citeknet.com/Products/IFilters/IFilterExplorer/tabid/62/Default.aspx 更多详情请看截图: http://screencast.com/t/xmWukanM+2)删除"WebSite/App_Data/MediaCache"文件夹下的所有文件;
3)重建Sitecore搜索索引(Sitecore->控制面板->索引->索引管理器);
4)清除Sitecore缓存(http://{hostname}/sitecore/admin/cache.aspx工具); 5)重启IIS;这篇关于Sitecore 7 pdf索引的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文