使用Solr索引/搜索PDF内容 [英] Index/Search PDF content with Solr

查看:381
本文介绍了使用Solr索引/搜索PDF内容的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在尝试Solr,遇到了这个问题:

I'm experimenting with Solr and I've encountered this issue:

我已经为PDF文档建立了索引,当我在管理控制台中搜索:"时,就会列出PDF.但是,当我在PDF中搜索内容时,没有任何结果.

I've indexed a PDF document and when I search for ":" in the admin console, the PDF is listed. However when I search for content within the PDF I get no results.

要为文档建立索引,我使用了以下复制和粘贴代码: http://wiki.apache .org/solr/ContentStreamUpdateRequestExample

To index the document, I used copy-and-paste code from: http://wiki.apache.org/solr/ContentStreamUpdateRequestExample

推荐答案

使用此命令

curl "http://localhost:8983/solr/update/extract?stream.file=/home/fstl/apache-solr-3.2.0/example/exampledocs/pup.pdf&stream.contentType=application/pdf&literal.id=esc.doc&commit=true" 

这篇关于使用Solr索引/搜索PDF内容的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆