ocr相关内容

Tesseract-OCR验证码:需要阅读文本

验证码-01 验证码-02 我已经应用了一些图像预处理。当我将此图像应用到pytesseract.image_to_string()时,它的结果很差,您能建议我一个更好的结果吗。 推荐答案 Tesseract不是为中断验证码而设计的。Tesseract需要没有最少瑕疵的清晰图像。 如果实现验证码,这是有原因的。与其破坏规则,不如联系站点管理员以达成合作协议,而不是违反 ..
发布时间:2022-08-12 14:55:41 其他开发

如何检测图像中是否包含ASCII字符?

我有一个图像数据集,我想过滤掉所有包含文本(ASCII字符)的图像。例如,我有一个可爱的狗狗形象: 如您所见,右下角有一段文字&2003年5月18日,因此应将其过滤掉。 经过一番研究,我发现了tesseractOCR。在python中,我有以下代码: # Attempt 1 img = Image.open('n02086240_1681.jpg') text = pytesse ..
发布时间:2022-04-12 13:27:52 Python

如何改进CAPCTHA解码的pytesseract功能?

我想从python中的图像中提取数字。为了做到这一点,我选择了pytesseract。当我尝试从图像中提取文本时,结果并不令人满意。我还检查了以下代码,并实现了与其他答案一起列出的所有技术。然而,它似乎表现不佳。 示例图片: 我的代码是: import cv2 as cv import pytesseract from PIL import Image import matplo ..
发布时间:2022-03-27 15:53:32 Python

使用Python从扫描的pdf中提取PDF数据

我正在用tesseract OCR从扫描的pdf中提取数据,我能够提取数据,但精度不是很好。在很多地方,它显示错误的数据,所以我可以100%准确地获取数据。 首先我将pdf转换为jpg格式,然后使用tesseract模块从图像中提取数据。 from PIL import Image import pytesseract text=(pytesseract.image_to_strin ..
发布时间:2022-03-27 15:50:42 其他开发

如何在使用tesseract-4.0进行文本提取时保留图像中的所有空格?

我正在使用tesseract-ocr 4.0从图像中提取表格文本,并在保持数据对齐的同时将结果导出到Excel中。 我希望在提取的表中保持图像中的所有空间不变。但OCR会跳过许多前导空格和尾随空格,并将其删除。 我有一些图像,在某些位置,表中出现空格。我在tesseract中使用了保留空白选项,但OCR仍然跳过了很多空格。 在使用OCR进行提取时,有没有办法检测或保留表中的所有空 ..
发布时间:2022-03-27 15:48:55 Python

如何从图像中提取虚线文本?

我正在做我的学士学位期末项目,我想创建一个OCR用于使用蟒蛇进行瓶子检查。我需要一些图像的文本识别的帮助。我是需要以更好的方式应用CV2操作,还是应该尝试其他方法? 我尝试对图像执行图像处理操作,并使用pytesseract识别字符。 使用我从这张照片中获得的以下代码: 到此: 然后转到这个: 锐化功能: def sharpen(img): sharpen ..
发布时间:2022-03-27 15:46:25 Python

Tesseract OCR将斜杠0混淆为8

我已经训练tesseract使用终结点字体,但无论如何,我都无法让它识别0。我正在使用jTessEditor创建培训tif和盒子。即使在验证时,它也会将全0读作8。我有什么遗漏的吗? 这里是0的一个示例,它将其读取为8: 我使用以下参数: --psm 10 -c tessedit_char_whitelist=0123456789# --oem 3 -l terminus ..
发布时间:2022-03-27 15:44:18 Python

对带有背景的图像进行倾斜(Python)

我正在处理一个项目,在该项目中,我正在对标签上的文本进行OCR。我的工作是对图像进行倾斜,使其可用tesseract读取。 我一直在使用this approach,对图片进行灰度和阈值处理,获取黑色像素坐标,在其周围绘制minAreaRect,然后根据此矩形的倾斜角度校正倾斜。这适用于,但不适用于具有背景的图像,如所显示的图像。在那里,它计算的倾斜角度为0.0,并且不旋转图像。(预期结果:1 ..
发布时间:2022-03-27 15:38:41 Python

如何增强Tesseract的OCR自动文本旋转功能?

我有一组PIL图像,其中一些页面被正确旋转,而另一些页面的旋转接近180°。这意味着自动方向检测可能会失败,因为不是178°识别2°方向。 遗憾的是,Tesseract有时无法识别2°方向和178°之间的差异,因此在后一种情况下,输出完全错误。 简单的im.rotate(180)可以自动修复这个问题,但该步骤是手动的,我希望tesseract自动了解文本是否颠倒。 看一下一些方法,它们需要 ..

收据中字符的褪色部分可以恢复吗?

我有一些文件包含一些扫描的收据,我需要使用OCR从其中提取文本。由于收据中打印的文字会在一段时间后淡出,因此收据中的某些文字不清晰,会影响OCR结果。 淡出单词的一些示例: 有什么方法可以恢复褪色的部分,以便我可以改善OCR结果? 我在OpenCV中尝试了图像阈值和图像平滑,但效果不是很理想。是否可以进一步处理该图像? 先取平均值,然后取高斯阈值 先是高斯模糊,然后是高斯阈值 ..
发布时间:2022-03-27 15:23:10 Python

Pytesseract集字符白名单

有人知道如何设置Pytesseract的字符白名单吗?我希望它只输出A-z和0-9。这个是可能的吗?我有以下内容: img = Image.open('test.jpg') result = pytesseract.image_to_string(img, config='-psm 6') 我正在为%1获取其他字符,如/,所以我想限制可能的字符选项。 推荐答案 您可以使用以下 ..
发布时间:2022-03-27 15:20:00 Python

是否使用多个点和灵活的大小裁剪图像?

我想创建一个类似于用于裁剪文档的凸轮扫描仪的应用程序。 但我需要与我的两个映像相同的功能。 显示的第一张图像摄像机捕获的图像.. 第二个图像识别捕获的图像部分,如下所示.. 我研究得越来越多,但没有得到任何成果,所以我在这里问一下,有没有人做过这件事告诉我.. 谢谢 推荐答案 我认为您的问题是检测要扫描的对象。 像模式匹配或功能检测这样的对象检测机制 ..
发布时间:2022-03-27 15:14:25 移动开发

如何查找所有基于图像的 PDF?

我的系统中有许多 PDF 文档,有时我注意到文档是基于图像的,没有编辑功能.在这种情况下,我进行 OCR 是为了在 Foxit PhantomPDF 中进行更好的搜索,您可以在多个文件中进行 OCR.我想找到我的所有基于图像的 PDF 文档. 我不明白 PDF 阅读器如何识别文档的 OCR 不是文本.这些读者必须访问某些字段.这也可以在终端中访问.这个答案给出了如何在线程检查PDF文件是否是 ..
发布时间:2022-01-24 23:17:25 Java开发

尝试构建 ABBYY Mobile OCR SDK 示例代码时出现构建错误

我已从 ABBYY 获得试用许可证并获得 iPhone 的试用 SDK.但我无法在我的设备上构建和调试项目.它给出了一个错误:“_OBJC_CLASS_$_CMocrManager",引用自: 该应用程序在模拟器中运行良好(示例中提供了一张图像). 请帮忙,我已附上截图. 解决方案 我已经联系了 abbyy mobile sdk 的技术支持,下面是关于内部版本号的回复: ..
发布时间:2022-01-19 21:15:53 其他开发

<canvas> 上的 JavaScript 文本识别和 OCR

我找到了一个可以识别手写数学方程式的网络应用程序: http://webdemo.visionobjects.com/equation.html?locale=default 我想知道是否有人知道实现此机制的应用程序或教程或开源项目,因为从这个 webapp 获取它真的很复杂. 注意:我只需要将画布中绘制的方程式翻译到输入文本框中即可. 解决方案 Tesseract OC ..
发布时间:2022-01-17 11:34:19 前端开发

使用 OCR 读取圆形文本

我想阅读对象上的文字.但是 OCR 程序无法识别它.当我给小部分时,它可以识别.我必须将圆形文本转换为线性文本.我怎样才能做到这一点?谢谢. 解决方案 您可以将图像从笛卡尔坐标系转换为极坐标系,为OCR程序准备圆路径文本图像.这个函数 logPolar() 可以提供帮助. 以下是准备圆路径文本图像的一些步骤: 使用 HoughCircles() 找到圆的中心. 求平均值并做一 ..
发布时间:2022-01-14 15:31:35 其他开发