如何实现用于索引重量级格式的 IFilter? [英] How to implement an IFilter for indexing heavyweight formats?

查看:54
本文介绍了如何实现用于索引重量级格式的 IFilter?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我需要为 Microsoft Search Server 2008 开发一个 IFilter,它执行长时间的计算以提取文本.从一个文件中提取文本可能需要 5 秒到 12 小时.我如何设计这样的 IFilter,以便守护程序不会在超时时重置它,并且其他 IFilter 挂断时也可以在超时时重置?

I need to develop an IFilter for Microsoft Search Server 2008 that performs prolonged computations to extract text. Extracting text from one file can take from 5 seconds to 12 hours. How can I desing such an IFilter so that the daemon doesn't reset it on timeout and also other IFilters can be reset on timeout if they hang up?

推荐答案

12 小时,哇!

如果需要很长时间并且有很多文件,您最好的选择是创建一个预处理应用程序来提取文本并使其可供 iFilter 访问.

If it takes that long and there are many files, your best option would be to create a pre-processing application that would extract the text and make it available for the iFilter to access.

另一种选择是创建文档的 html 摘要并指示搜寻器将它们编入索引.如有必要,摘要页面是否可以轻松链接到文档本身.

Another option would be to create html summaries of the documents and instruct the crawler to index those. If the summary page could easily link to the document itself if necessary.

这篇关于如何实现用于索引重量级格式的 IFilter?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆