Sitecore 7 pdf索引 [英] Sitecore 7 pdf indexing

查看:16
本文介绍了Sitecore 7 pdf索引的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我尝试使用Sitecore 7为PDF文件建立索引。 我安装了IFilter,但在爬网程序日志中收到下一个错误:

ManagedPoolThread #17 09:24:20 WARN  LuceneIndexOperations : Update : Could not build document data 4433434-3443-3223-91c4-233232. Skipping.
Exception: System.Runtime.InteropServices.COMException
Message: Error HRESULT E_FAIL has been returned from a call to a COM component.
Source: mscorlib
   at System.Runtime.InteropServices.ComTypes.IPersistFile.Load(String pszFileName, Int32 dwMode)
   at Sitecore.ContentSearch.Extracters.IFilterTextExtraction.FilterLoader.LoadAndInitIFilter(String fileName, String extension)
   at Sitecore.ContentSearch.Extracters.IFilterTextExtraction.FilterReader..ctor(String fileName)
   at Sitecore.ContentSearch.ComputedFields.MediaItemIFilterTextExtractor.ComputeFieldValue(IIndexable indexable)
   at Sitecore.ContentSearch.ComputedFields.MediaItemContentExtractor.ComputeFieldValue(IIndexable indexable)
   at Sitecore.ContentSearch.LuceneProvider.LuceneDocumentBuilder.AddComputedIndexFields()
   at Sitecore.ContentSearch.LuceneProvider.LuceneIndexOperations.GetIndexData(IIndexable indexable, IIndexable latestVersion, IProviderUpdateContext context)
   at Sitecore.ContentSearch.LuceneProvider.LuceneIndexOperations.BuildDataToIndex(IProviderUpdateContext context, IIndexable version, IIndexable latestVersion)
   at Sitecore.ContentSearch.LuceneProvider.LuceneIndexOperations.<>c__DisplayClass7.<Update>b__0(Item version)

我必须做的工作,因为在Sitecore文档中,他们说必须开箱即用。

推荐答案

我遇到了同样的问题,我收到了Sitecore支持人员的下一个响应(之后工作正常):

1)将所有Adobe iFilter.dll文件复制到"System32Inetsrv"文件夹。这是Windows Server上的IIS的工作目录。 默认情况下,Adobe iFilter.dll文件存储在"C:Program FilesAdobe PDF iFilter 9 for 64-bit Platform Sin"文件夹中。 您还可以使用"IFilter Explorer"工具检测存储.dll文件的文件夹: http://www.citeknet.com/Products/IFilters/IFilterExplorer/tabid/62/Default.aspx 更多详情请看截图: http://screencast.com/t/xmWukanM+

2)删除"WebSite/App_Data/MediaCache"文件夹下的所有文件;

3)重建Sitecore搜索索引(Sitecore->控制面板->索引->索引管理器);

4)清除Sitecore缓存(http://{hostname}/sitecore/admin/cache.aspx工具); 5)重启IIS;

这篇关于Sitecore 7 pdf索引的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆