用Sphinx索引Word文档和PDF [英] Indexing Word Documents and PDFs with Sphinx

查看:260
本文介绍了用Sphinx索引Word文档和PDF的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有一个网站,用户可以在其中上传.doc和.pdf格式的文档.我正在使用Sphinx在SQL数据库(MySQL)上进行全文搜索.用Sphinx索引这些文件格式的最佳方法是什么?

I have a website where users upload documents in .doc and .pdf format. I am using Sphinx to conduct full text searches on my SQL database (MySQL). What is the best way to index these file formats with Sphinx?

推荐答案

不幸的是,Sphinx无法直接为这些文件类型建立索引.您需要将文本内容导入数据库或 an Sphinx可以理解的XML格式.

Unfortunately, Sphinx can't index those file types directly. You'll need to either import the textual contents into a database, or into an XML format that Sphinx can understand.

这篇关于用Sphinx索引Word文档和PDF的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆