搜索在线PDF/MS-WORD文件 [英] Search in online PDF/MS-WORD files

查看:171
本文介绍了搜索在线PDF/MS-WORD文件的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述



我正在开发一种工具,可以搜索用户在给定站点上输入的关键字.我的问题是,它仅在html/web页面上搜索关键字,而不在网站上找到的PDF/MS-Word文件上搜索.

谁能为我推荐一些api/工具或提供可以从在线PDF/MS-Word/Text文件中搜索文本的代码?我只需要下载包含特定关键字(文本)的那些文件.

Hi,

I''m developing a tool that searches the keyword entered by the user on a given site. My problem is, it searches the keyword only on html/web pages but not on the PDF/MS-Word files found on the site.

Can anyone suggest me some api/tool or provide the code that can search text from the online PDF/MS-Word/Text file? I need to download only those files that contain a particular keyword (text).

推荐答案

该网站是否在其他地方,或者它是您的网站?如果要在站点上搜索,则可以使用索引服务器搜索文档.如果它在其他服务器上,则您将不得不采用更强力的方法.

使用蛮力方法,您将需要将文档复制到系统上,然后使用IFilter COM API从文档中获取文本.看看 [
Is this site elsewhere, or is it your site? If you are searching on your site then you can use the Index Server to search through the documents. If it''s on a different server then you will have to adopt a more brute force approach.

With the brute force approach, you will need to copy the document onto your system and then use the IFilter COM API to get the text from the document. Have a look at this[^] article for more detail on how to use it.


这篇关于搜索在线PDF/MS-WORD文件的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆