ocr 第7页 - IT屋-程序员软件开发技术分享社区

为什么pytesseract不能识别个位数?

我正在一个网站上执行 ocr，特别是在这两个图像上: 我对 OCR 相当陌生，我使用以下内容: from PIL 导入图片导入 pytesseractmy_image = '....png'文本 = pytesseract.image_to_string(Image.open(my_image)) 在第二张图片中，它可以识别除单个数字 3、4、5、6 之外的所有内容. 在第一张图片 ..

数字识别，使用opencv

我有 4 张小图片. 有数字 6、16、9 和 9.我将图片与数字与我的模板进行比较，只有 30 个变体 [0-30].图片 - 截图是.数字出现在正方形的不同位置(示例中左角为 9，右角为 9). 我使用两种方法:计算白色像素的数量. original = cv2.imread('im/16.png')寻求 = [254,254,254]结果 = np.count_nonzero( ..

发布时间：2021-06-12 18:35:17 python opencv ocr Python

我已经编写了从 PDF 文件中抓取所有数据的 Python 代码.这里的问题是，一旦被刮掉，单词就会失去语法.如何解决这些问题?我附上了代码. from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter从 pdfminer.converter 导入 TextConverter从 pdfminer.layout 导入 ..

发布时间：2021-06-12 18:35:14 python pdf ocr pdfminer pdf-scraping Python

是否可以使用pytesseract从图像的特定部分提取文本

我在图像中有边界框(矩形的坐标)并想在该坐标内提取文本.如何使用 pytesseract 提取该坐标内的文本? 我尝试使用 opencv 将图像部分复制到其他 numpyarray cropped_image = image[y1:y2][x1:x2] 并尝试了 pytesseract.image_to_string().但准确度非常差.但是当我尝试将原始图像转换为 pytesserac ..

发布时间：2021-06-12 18:35:11 python opencv ocr text-extraction python-tesseract Python

为什么 pytesseract 无法识别背景较暗的图像中的数字?

我有这个 python 代码，我用来将写在图片中的文本转换为字符串，它确实适用于某些具有大字符的图像，但不适用于我现在正在尝试的仅包含数字的图像. 这是图片: 这是我的代码: 导入pytesseract从 PIL 导入图像img = Image.open('img.png')pytesseract.pytesseract.tesseract_cmd = 'C:/Program Fil ..

发布时间：2021-06-12 18:35:08 python python-3.x ocr python-tesseract Python

如何使用opencv集中和调整数字大小?

我想对一些扫描的表格(手工填写)进行 OCR.这是我第一次使用计算机视觉做一些严肃的事情.到目前为止，我能够找到包含日期字段数字的方块: 查看 OpenCV 附带的示例手写数字数据集，我看到数字被集中并调整为 (20, 20): 由于这可能是一个相当普遍的问题，我想知道该算法是否已经在 OpenCV(或 numpy、scipy等)，这样我就不必重新发明轮子了. 问题是:Pytho ..

发布时间：2021-06-03 18:32:03 python opencv numpy ocr mnist Python

如何使用python从屏幕的给定区域拍摄快照?

这是我的想法:1) 从屏幕上对给定区域进行快照，如 (100,100,80,60)，将结果保存为图像2)使用OpenCV python界面处理图像只是第一个使用python的人，想知道这是否是一个很好的解决方案，想知道如何使用python进行快照. 谢谢解决方案在Apple的 CoreGraphics api中使用 CGRectMake 相当简单: CG.CGRect ..

发布时间：2021-05-31 19:24:23 python macos opencv ocr Python

如何使用Android OCR识别名片资料图片

我有一个本地android移动应用程序.我想扫描名片内的用户个人资料图片，然后在我的移动应用程序中检索该图片.我该如何处理? 解决方案如果您的全名由名字和姓氏组成，并用空格分隔，则可以使用""以获得名字和姓氏. 示例: 字符串fullName ="Jason Brave";字符串firstName =“"“;字符串lastName =“"“;String []名称= fullNa ..

发布时间：2021-05-31 18:47:07 java android machine-learning ocr Java开发

如何在 OCR 中区分斜线零和八 (0-> 8)

我正在将 ML Kit for Firebase 用于我的 Android 应用程序(ReCalc:收据计算器)，除了斜线零的情况外，它的性能非常好.在大约一半或更多的情况下，它会将斜杠零识别为八. 我的一个主意是将包含零区域的矩形切成薄片，并检测正好位于中间上方和下方的区域是否较暗.但是实际上... 我正计划训练模型以对零和八进行分类. 这是很多工作，因此我决定首先在这里要求其 ..

发布时间：2021-05-31 18:39:19 machine-learning ocr firebase-mlkit AI人工智能

将“名字"分为"Java的名字和姓氏"(Android OCR)

我已经使用本机Android JAVA创建了OCR(光学字符识别)应用程序.我可以将图像转换为文本视图.但是，如何使用这些单词分别识别名字，姓氏，电子邮件地址?您能给我该过程的示例代码吗? 示例 Jason Brave JSON43@gmail.com 在这里 Jason是名字.勇敢是第二个名字，而 JSON43@gmail.com是电子邮件. 解决方案执行以下操 ..

发布时间：2021-05-31 18:33:22 java android machine-learning ocr Java开发

Tesseract OCR无法识别除法符号“÷".

我正在将iOS 8中的Tesseract用于基于OCR的应用程序，但是它错误地将图像中的“÷"符号转换为加号"+". 例如，这张图片我尝试过的所有操作始终返回加号"+"而不是除号“÷". 我尝试仅使用经过训练的"equ"数据文件，并且DOES正确返回了分隔符号-但是所有其他字符都将变成垃圾. 我已经研究了好几天(Google，Stackoverflow)，无法解决. ..

发布时间：2021-05-16 20:55:58 ios objective-c ocr tesseract 移动开发

尝试计算图像分割结果的准确性时，为什么输出为0?

我使用 bboxPrecisionRecall ..

发布时间：2021-05-15 20:39:44 matlab image-processing ocr image-segmentation 其他开发

提高扫描文档的OCR准确性

我正在使用标准的Brother A3多功能打印机扫描许多A3文档，然后使用FineReader Pro对图像进行OCR处理. 但是，我在识别的字符中遇到很多错误，并且遇到了许多非字母数字的奇怪字符. 有人可以给我任何以编程方式提高OCR准确性的提示吗?可以对扫描的图像进行预处理，也可以对识别的文本进行后处理? 编辑:查找示例pdf .其中包括一些样本图片，我得出的结果最差. ..

发布时间：2021-05-15 20:31:24 image-processing ocr image-scanner text-recognition 其他开发

在通过pytesseract ocr模块之前是否可以检查图像的方向

对于我当前的ocr项目，我尝试使用tesserect使用python封面pytesseract将图像转换为文本文件.到现在为止，我只将面向直线的图像传递到我的模块中，因为它能够正确找出该图像中的文本.但是现在当我传递旋转的图像时，它甚至无法识别一个单词.因此，要获得良好的效果，我只需要以正确的方向传递图像.现在，我想知道在将图像传递到ocr模块之前，是否有任何方法可以弄清楚图像的方向.请让我知道我 ..

发布时间：2021-05-15 20:30:58 image-processing ocr tesseract python-tesseract 其他开发

删除边框线上方的图像顶部以检测文本文档

使用OpenCV(python)，我试图在下图所示的图像中删除边界线上方的图像部分(此示例图像中的白色区域，原始位置被扭曲). ..

发布时间：2021-05-15 20:29:14 python opencv image-processing ocr tesseract Python

如何在支票/支票图像中提取帐号

我正在执行一项任务，目的是从支票图像中提取帐号.我目前的方法可以分为2个步骤本地化帐号数字(印刷数字) 使用像 Tesseract OCR 这样的OCR库执行OCR 第二步很简单，假设我们已经正确定位了帐号数字我尝试使用 OpenCV 等高线方法和 MSER (最大稳定的末梢区域)来定位帐号数字，但是没有得到有用的结果.很难归纳模式，因为不同的银行支票的模板有所不 ..

发布时间：2021-05-15 20:11:09 python image opencv image-processing ocr Python

tesseract可以接受非字体符号的培训吗?

我很好奇如何才能更可靠地识别出扑克牌图像的价值和适合程度.这是两个示例: 新数据集图像分类我将其指向我的卡文件夹，例如:/path/to/card 根据此处的讨论，我将验证百分比设置为13.0％: https://stackoverflow.com/a/13612921/880837 创建数据集后，我打开了“模型"选项卡选择我的新数据集. 选择“标准网络"下的GoogLeN ..

发布时间：2021-05-15 20:09:32 image macos ocr tesseract 其他开发

是否可以使用Google Vision API一次扫描10张图像?到目前为止，只做1次

我们当前正在使用google vision API进行ocr项目，其中图像返回文本值...但是到目前为止，我们仅能处理1张图像，是否可以处理10张图像?即时通讯使用python，此代码仅运行一张图片..谢谢 import os，io从google.cloud导入愿景从google.cloud.vision导入类型将熊猫作为pd导入os.environ ['GOOGLE_APPLICATION_ ..

发布时间：2021-05-12 19:49:25 python google-cloud-platform ocr google-vision Python

Google App脚本:如何将PDF转换为GDOC以获得OCR?

我正在尝试编写一些代码，以搜索我已经拥有的序列号的PDF(gmail)，将其保存在云端硬盘中，在其上获取OCR并读取内容. 第一步没有问题，第二步使用以下代码进行管理，但是使用 DocumentApp 打开文档以获取getText()的最后两行不起作用: var serial ="123456789";var ret = DriveApp.searchFiles('fullText包含“ ..

发布时间：2021-05-11 20:52:16 javascript google-apps-script google-drive-api ocr userscripts 前端开发

Java中的象形文字或符号识别(Android)

我正在制作一款Android游戏，其核心机制是“施法".通过绘制先前指定的符号.我为此尝试了Tesseract，但它将胡言乱语识别为符号，并且没有任何方法(据我所知)来衡量与任何符号的相似性.我可以使用哪种神经网络/OCR实用程序执行任务? 解决方案结果证明我需要的是置信度得分.到目前为止，我是从命令行使用Tesseract的.TSV输出选项可以完成此任务: tesseract te ..

发布时间：2021-05-09 20:33:41 java android neural-network ocr game-development Java开发

ocr相关内容