ocr相关内容

用pytesser识别简单数字

我正在使用PyTesser和Tesseract学习OCR.作为第一个里程碑,我想编写一个仅由一些数字组成的识别验证码的工具.我阅读了一些教程,并编写了这样的测试程序. from pytesser.pytesser import * from PIL import Image, ImageFilter, ImageEnhance im = Image.open("test.tiff") im ..
发布时间:2020-05-19 19:35:39 Python

为Tesseract训练特定单词-可能吗?

我想使用Tesseract从文档中提取大约10-20个关键字.该文档将包含所有英文字符/单词.我感兴趣的是“年龄:23​​"之类的东西.在这里,年龄是我感兴趣的关键字,并且也要提取23(该值). 我想到的第一种方法是将整个页面提取到文本中,然后在可识别的文本中查找关键字.但是,在训练整形方面,如果我知道这些关键字,是否有更好的方法,这可能会导致更好的准确性? 我或多或少意识到Tesse ..
发布时间:2020-05-19 19:35:34 其他开发

如何为PHP(开源)设置和运行Tesseract OCR?

我已经根据GitHUb上提供的文档通过MacPorts安装了Tesseract OCR,并且安装成功,并且 但是,我正在尝试将Tesseract OCR用于PHP( https://github. com/thiagoalessio/tesseract-ocr-for-php ),因此我下载了zip文件并将该库包含到我的php文件中,并使用了 echo (new TesseractOC ..
发布时间:2020-05-19 19:35:31 PHP

Tess4j问题java.lang.UnsatisfiedLinkError

我正在尝试解决Tess4J的安装问题, 1我已经在WEB-INF \ win32-x86 中创建了一个文件夹 2,然后将libtesseract302.dll和liblept168.dll放在此处,并将其添加到Java构建路径中的source/native库中 当我运行时,我发现了错误 java.lang.UnsatisfiedLinkError: Unable to load libr ..
发布时间:2020-05-19 19:35:27 Java开发

在Windows Phone 7.5中扫描文本(OCR)

是否可以强制 Zxing库仅扫描文本?我正在寻找脱机(非云)解决方案来扫描Windows Phone中的文本. OR 集成的Bing视觉成功扫描了图像中的文本.有没有一种方法可以在我们的应用程序中调用相同的任务(例如Microsoft.Phone.Tasks)? 解决方案 据我所知,没有本机.NET OCR引擎.从理论上讲,您可以使用任何适用于Win CE的OCR SDK(只要 ..
发布时间:2020-05-19 19:35:24 其他开发

找不到Tesseract OCR Android tessdata目录

我目前正在使用OCR开发一个Android应用,并且已经达到了调用BaseAPI.init()方法的地步.我不断收到错误消息,指出该目录必须包含tessdata作为子文件夹.我检查了文件目录是否包含其中包含trainingdata文件的文件夹,并确保我指向了正确的目录.我真的很想解决这个问题. 我指向的目录是/mnt/sdcard/Image2Text/.我已确保tessdata是其中包含必 ..
发布时间:2020-05-19 19:35:21 移动开发

结合使用Ruby和Ubuntu和光学字符识别

我是一名大学生,是时候再次购买教科书.这个季度,我上课需要超过20本书.通常,这没什么大不了的,因为我只是将ISBN复制并粘贴到Amazon中.但是,ISBN会在我学校的书本网站上转换为图像.我要做的就是将ISBN放入一个字符串中,这样就不必手动键入每个ISBN了.我已经使用GOCR将图像转换为文本,但是我想将其与Ruby脚本一起使用,以便我可以自动执行该过程并对同学进行相同的操作. 我可以 ..
发布时间:2020-05-19 19:35:19 其他开发

Android:如何在不拍照的情况下从相机捕获文本?

我想使用tess-two(在android和eclipse中)捕获用相机显示的文本和数字而不用拍照. 我不想保存图像文件. 类似的东西(它正在相机上实时捕获): 我使用过tess-two,但是我必须先拍照然后捕获文本. (使用链接: https://stackoverflow.com/questions/19533273 /best-ocr-optical-character-reco ..
发布时间:2020-05-19 19:35:17 移动开发

将图像转换为可搜索的pdf

嗨,我正在寻找可以将tiff图像转换为可搜索pdf(OCR)的开源Java API.我到处都有研究,但到目前为止什么都没发现. 注意 我看了这篇文章,但是此API并未将图像转换为pdf Java OCR实现.但是,我仍然在玩一些代码. 解决方案 您可以使用iText将图像转换为PDF.这里的难点是执行OCR,而不是创建PDF. 我会警告您:任何值得使用的OCR引擎都会使您花费大 ..
发布时间:2020-05-19 19:35:13 Java开发

将pdf转换为图像,但放大后

此链接显示了pdf s可以转换为图像.有没有办法在转换为图像之前缩放pdf?在我的项目中,我将pdf s转换为png s,然后使用Python-tesseract库提取文本.我注意到,如果我缩放pdf s并将零件另存为png s,那么OCR会提供更好的结果.那么有没有办法在转换为png之前先缩放pdf? 解决方案 我认为提高图像的质量(分辨率)比放大pdf更好. 使用pdf2imag ..
发布时间:2020-05-19 19:35:11 其他开发

通过Windows命令行将TIFF转换为PDF

我正在寻找一种免费方法,可以将大量tif文件(10-20k)创建为PDF文件,理想情况下也可以使用OCR. 它必须可以在Windows的命令行中调用. 解决方案 您可以使用 XnView应用程序.它也有命令行. 另一种选择可能是 IrfanView . ..
发布时间:2020-05-19 19:35:06 其他开发

Google ML Kit:等待文本识别模型下载

[mlkit] 我正在从适用于Android的Google机器学习套件中实现“设备上的文字识别".我遵循了本指南,但是每次尝试检测我得到的文本例外 “等待下载文本识别模型.请稍候." 显然,等待无济于事,10秒钟后进行新检测也无济于事. 我有元标记 ..
发布时间:2020-05-19 19:35:01 移动开发

Python Tesseract无法识别此字体

我有这张图片: 我想使用python将其读取为字符串,我认为这并不难.我遇到过tesseract,然后使用tesseract封装了python脚本. 所以我开始阅读图像,在我尝试阅读此图像之前,它做得非常好.我是否必须训练它以阅读特定字体?关于该特定字体有什么想法吗?还是有更好的OCR引擎可以与python配合使用来完成这项工作. 编辑:也许我可以在数字周围做一些矢量,然后以更大 ..
发布时间:2020-05-19 19:34:59 Python

tesseract没有得到标签

我已经在Linux环境中安装了tesseract. 当我执行 之类的命令时,它可以工作 # tesseract myPic.jpg /output 但是我的照片上有一些小标签,而tesseract没有看到它们. 是否可以使用一个选项来设置音高或类似的设置? 文字标签示例: 在这张照片中,tesseract无法识别任何价值... 但是有这张照片: 我有以下 ..
发布时间:2020-05-19 19:34:56 其他开发

使用谷歌视觉OCR API从特定图像位置提取数据

我正在使用Google的Vision OCR API尝试从图像中提取2种类型的数据:1)从文本框中输入手写文本;下方标有红色圆圈,并在复选框中标有2)勾号或"x";下面用绿色圆圈标记.我将把这些数据输入数据库,所以我需要为这两种类型的数据返回一个字符串 当前,当我将此图像传递到API时,我得到了包含所有数据的字符串: 中学学习学生对计算机的感知LO 13.您的家人有没有在计算机/IT领 ..
发布时间:2020-05-19 19:34:53 C#/.NET

从笔记本中提取文本

我正在尝试从图像中提取手写文本.我将python与opencv函数(例如find_contours)一起使用.当我使用这样的图像时,一切都很好: 效果很好,因为我有简单的背景.但是后来我用这张图片对其进行了测试: 由于背景中笔记本的线条,我无法仅提取文本.尽管文本为红色,但我将所有图像都设为灰度或有时达到阈值,因此所有颜色都变为黑色,就像笔记本上的线条一样.这样,文本的颜色就无关紧要. ..
发布时间:2020-05-19 19:34:47 Python