索引PDF文件如何使用可能Lucene.Net? [英] How might I index PDF files using Lucene.Net?

查看:251
本文介绍了索引PDF文件如何使用可能Lucene.Net?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我在找一些示例代码,演示如何使用索引和Lucene.Net C#的PDF文档。谷歌翻了几下,但没有,我能找到有帮助的。

I'm looking for some sample code demonstrating how to index PDF documents using Lucene.Net and C#. Google turned up a few, but none that I could find helpful.

推荐答案

从我的理解,Lucene是仅限于创建索引和搜索的索引。它是由应用程序来处理打开文件和索引中提取它们的内容。所以,如果你正在寻找搜索PDF文档,你会想使用类似 iTextSharp的打开文件,拔出的内容,并将它传递给Lucene的索引。有在 Dimecasts.net 网站使用Lucene的一些好的出发的例子。

From my understanding, Lucene is limited to creating an index and searching that index. It's up to the application to handle opening files and extracting their contents for the index. So if you're looking to search PDF documents you'll want to use something like iTextSharp to open the file, pull out the contents, and pass it to Lucene for indexing. There are some good starting examples of using Lucene on the Dimecasts.net website.

这篇关于索引PDF文件如何使用可能Lucene.Net?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆