扫描的图像/PDF到可搜索的图像/PDF [英] Scanned Image/PDF to Searchable Image/PDF

查看:235
本文介绍了扫描的图像/PDF到可搜索的图像/PDF的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

有人可以建议我如何将扫描的图像转换为可搜索的图像,或者将扫描的pdf转换为可搜索的pdf吗?
从现在开始,我一直陷于这种情况.
我曾在ubuntu中尝试过pdfocr应用程序,但没有成功.

Can anyone suggest me how to convert a scanned image into a searchable image or a scanned pdf to a searchable pdf ?
I have been stuck in this situation since quite a while now.
i have tried pdfocr application in ubuntu but no success.

推荐答案

Tesseract 3.03版支持从图像创建可搜索的PDF.对于PDF,可以先使用GhostScript将其转换为图像,然后再将其发送到Tesseract.

Tesseract version 3.03 supports creation of searchable PDF from image. For PDF, you can use GhostScript to convert it to image before sending it to Tesseract.

https://github.com/tesseract-ocr/tesseract

这篇关于扫描的图像/PDF到可搜索的图像/PDF的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆