ocr相关内容

为什么pytesseract不能识别个位数?

我正在一个网站上执行 ocr,特别是在这两个图像上: 我对 OCR 相当陌生,我使用以下内容: from PIL 导入图片导入 pytesseractmy_image = '....png'文本 = pytesseract.image_to_string(Image.open(my_image)) 在第二张图片中,它可以识别除单个数字 3、4、5、6 之外的所有内容. 在第一张图片 ..
发布时间:2021-06-12 18:35:22 Python

数字识别,使用opencv

我有 4 张小图片. 有数字 6、16、9 和 9.我将图片与数字与我的模板进行比较,只有 30 个变体 [0-30].图片 - 截图是.数字出现在正方形的不同位置(示例中左角为 9,右角为 9). 我使用两种方法:计算白色像素的数量. original = cv2.imread('im/16.png')寻求 = [254,254,254]结果 = np.count_nonzero( ..
发布时间:2021-06-12 18:35:17 Python

我想用 python 抓取印地语(印度语)pdf 文件

我已经编写了从 PDF 文件中抓取所有数据的 Python 代码.这里的问题是,一旦被刮掉,单词就会失去语法.如何解决这些问题?我附上了代码. from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter从 pdfminer.converter 导入 TextConverter从 pdfminer.layout 导入 ..
发布时间:2021-06-12 18:35:14 Python

是否可以使用pytesseract从图像的特定部分提取文本

我在图像中有边界框(矩形的坐标)并想在该坐标内提取文本.如何使用 pytesseract 提取该坐标内的文本? 我尝试使用 opencv 将图像部分复制到其他 numpyarray cropped_image = image[y1:y2][x1:x2] 并尝试了 pytesseract.image_to_string().但准确度非常差.但是当我尝试将原始图像转换为 pytesserac ..
发布时间:2021-06-12 18:35:11 Python

为什么 pytesseract 无法识别背景较暗的图像中的数字?

我有这个 python 代码,我用来将写在图片中的文本转换为字符串,它确实适用于某些具有大字符的图像,但不适用于我现在正在尝试的仅包含数字的图像. 这是图片: 这是我的代码: 导入pytesseract从 PIL 导入图像img = Image.open('img.png')pytesseract.pytesseract.tesseract_cmd = 'C:/Program Fil ..
发布时间:2021-06-12 18:35:08 Python

如何使用opencv集中和调整数字大小?

我想对一些扫描的表格(手工填写)进行 OCR.这是我第一次使用计算机视觉做一些严肃的事情.到目前为止,我能够找到包含日期字段数字的方块: 查看 OpenCV 附带的示例手写数字数据集,我看到数字被集中并调整为 (20, 20): 由于这可能是一个相当普遍的问题,我想知道该算法是否已经在 OpenCV(或 numpy、scipy等),这样我就不必重新发明轮子了. 问题是:Pytho ..
发布时间:2021-06-03 18:32:03 Python

如何使用python从屏幕的给定区域拍摄快照?

这是我的想法:1) 从屏幕上对给定区域进行快照,如 (100,100,80,60),将结果保存为图像2)使用OpenCV python界面处理图像 只是第一个使用python的人,想知道这是否是一个很好的解决方案,想知道如何使用python进行快照. 谢谢 解决方案 在Apple的 CoreGraphics api中使用 CGRectMake 相当简单: CG.CGRect ..
发布时间:2021-05-31 19:24:23 Python

如何使用Android OCR识别名片资料图片

我有一个本地android移动应用程序.我想扫描名片内的用户个人资料图片,然后在我的移动应用程序中检索该图片.我该如何处理? 解决方案 如果您的全名由名字和姓氏组成,并用空格分隔,则可以使用""以获得名字和姓氏. 示例: 字符串fullName ="Jason Brave";字符串firstName =“"“;字符串lastName =“"“;String []名称= fullNa ..
发布时间:2021-05-31 18:47:07 Java开发

如何在 OCR 中区分斜线零和八 (0-> 8)

我正在将 ML Kit for Firebase 用于我的 Android 应用程序(ReCalc:收据计算器),除了斜线零的情况外,它的性能非常好.在大约一半或更多的情况下,它会将斜杠零识别为八. 我的一个主意是将包含零区域的矩形切成薄片,并检测正好位于中间上方和下方的区域是否较暗.但是实际上... 我正计划训练模型以对零和八进行分类. 这是很多工作,因此我决定首先在这里要求其 ..
发布时间:2021-05-31 18:39:19 AI人工智能

将“名字"分为"Java的名字和姓氏"(Android OCR)

我已经使用本机Android JAVA创建了OCR(光学字符识别)应用程序.我可以将图像转换为文本视图.但是,如何使用这些单词分别识别名字,姓氏,电子邮件地址?您能给我该过程的示例代码吗? 示例 Jason Brave JSON43@gmail.com 在这里 Jason是名字.勇敢是第二个名字,而 JSON43@gmail.com是电子邮件. 解决方案 执行以下操 ..
发布时间:2021-05-31 18:33:22 Java开发

Tesseract OCR无法识别除法符号“÷".

我正在将iOS 8中的Tesseract用于基于OCR的应用程序,但是它错误地将图像中的“÷"符号转换为加号"+". 例如,这张图片 我尝试过的所有操作始终返回加号"+"而不是除号“÷". 我尝试仅使用经过训练的"equ"数据文件,并且DOES正确返回了分隔符号-但是所有其他字符都将变成垃圾. 我已经研究了好几天(Google,Stackoverflow),无法解决. ..
发布时间:2021-05-16 20:55:58 移动开发

提高扫描文档的OCR准确性

我正在使用标准的Brother A3多功能打印机扫描许多A3文档,然后使用FineReader Pro对图像进行OCR处理. 但是,我在识别的字符中遇到很多错误,并且遇到了许多非字母数字的奇怪字符. 有人可以给我任何以编程方式提高OCR准确性的提示吗?可以对扫描的图像进行预处理,也可以对识别的文本进行后处理? 编辑:查找示例pdf .其中包括一些样本图片,我得出的结果最差. ..
发布时间:2021-05-15 20:31:24 其他开发

在通过pytesseract ocr模块之前是否可以检查图像的方向

对于我当前的ocr项目,我尝试使用tesserect使用python封面pytesseract将图像转换为文本文件.到现在为止,我只将面向直线的图像传递到我的模块中,因为它能够正确找出该图像中的文本.但是现在当我传递旋转的图像时,它甚至无法识别一个单词.因此,要获得良好的效果,我只需要以正确的方向传递图像.现在,我想知道在将图像传递到ocr模块之前,是否有任何方法可以弄清楚图像的方向.请让我知道我 ..
发布时间:2021-05-15 20:30:58 其他开发

如何在支票/支票图像中提取帐号

我正在执行一项任务,目的是从支票图像中提取帐号.我目前的方法可以分为2个步骤 本地化帐号数字(印刷数字) 使用像 Tesseract OCR 这样的OCR库执行OCR 第二步很简单,假设我们已经正确定位了帐号数字 我尝试使用 OpenCV 等高线方法和 MSER (最大稳定的末梢区域)来定位帐号数字,但是没有得到有用的结果.很难归纳模式,因为 不同的银行支票的模板有所不 ..
发布时间:2021-05-15 20:11:09 Python

tesseract可以接受非字体符号的培训吗?

我很好奇如何才能更可靠地识别出扑克牌图像的价值和适合程度.这是两个示例: 新数据集图像 分类 我将其指向我的卡文件夹,例如:/path/to/card 根据此处的讨论,我将验证百分比设置为13.0%: https://stackoverflow.com/a/13612921/880837 创建数据集后,我打开了“模型"选项卡 选择我的新数据集. 选择“标准网络"下的GoogLeN ..
发布时间:2021-05-15 20:09:32 其他开发

是否可以使用Google Vision API一次扫描10张图像?到目前为止,只做1次

我们当前正在使用google vision API进行ocr项目,其中图像返回文本值...但是到目前为止,我们仅能处理1张图像,是否可以处理10张图像?即时通讯使用python,此代码仅运行一张图片..谢谢 import os,io从google.cloud导入愿景从google.cloud.vision导入类型将熊猫作为pd导入os.environ ['GOOGLE_APPLICATION_ ..
发布时间:2021-05-12 19:49:25 Python

Google App脚本:如何将PDF转换为GDOC以获得OCR?

我正在尝试编写一些代码,以搜索我已经拥有的序列号的PDF(gmail),将其保存在云端硬盘中,在其上获取OCR并读取内容. 第一步没有问题,第二步使用以下代码进行管理,但是使用 DocumentApp 打开文档以获取getText()的最后两行不起作用: var serial ="123456789";var ret = DriveApp.searchFiles('fullText包含“ ..

Java中的象形文字或符号识别(Android)

我正在制作一款Android游戏,其核心机制是“施法".通过绘制先前指定的符号.我为此尝试了Tesseract,但它将胡言乱语识别为符号,并且没有任何方法(据我所知)来衡量与任何符号的相似性.我可以使用哪种神经网络/OCR实用程序执行任务? 解决方案 结果证明我需要的是置信度得分.到目前为止,我是从命令行使用Tesseract的.TSV输出选项可以完成此任务: tesseract te ..
发布时间:2021-05-09 20:33:41 Java开发