ocr相关内容
验证码-01 验证码-02 我已经应用了一些图像预处理。当我将此图像应用到pytesseract.image_to_string()时,它的结果很差,您能建议我一个更好的结果吗。 推荐答案 Tesseract不是为中断验证码而设计的。Tesseract需要没有最少瑕疵的清晰图像。 如果实现验证码,这是有原因的。与其破坏规则,不如联系站点管理员以达成合作协议,而不是违反
..
我有一个图像数据集,我想过滤掉所有包含文本(ASCII字符)的图像。例如,我有一个可爱的狗狗形象: 如您所见,右下角有一段文字&2003年5月18日,因此应将其过滤掉。 经过一番研究,我发现了tesseractOCR。在python中,我有以下代码: # Attempt 1 img = Image.open('n02086240_1681.jpg') text = pytesse
..
我想从python中的图像中提取数字。为了做到这一点,我选择了pytesseract。当我尝试从图像中提取文本时,结果并不令人满意。我还检查了以下代码,并实现了与其他答案一起列出的所有技术。然而,它似乎表现不佳。 示例图片: 我的代码是: import cv2 as cv import pytesseract from PIL import Image import matplo
..
我正在用tesseract OCR从扫描的pdf中提取数据,我能够提取数据,但精度不是很好。在很多地方,它显示错误的数据,所以我可以100%准确地获取数据。 首先我将pdf转换为jpg格式,然后使用tesseract模块从图像中提取数据。 from PIL import Image import pytesseract text=(pytesseract.image_to_strin
..
我正在使用tesseract-ocr 4.0从图像中提取表格文本,并在保持数据对齐的同时将结果导出到Excel中。 我希望在提取的表中保持图像中的所有空间不变。但OCR会跳过许多前导空格和尾随空格,并将其删除。 我有一些图像,在某些位置,表中出现空格。我在tesseract中使用了保留空白选项,但OCR仍然跳过了很多空格。 在使用OCR进行提取时,有没有办法检测或保留表中的所有空
..
我正在做我的学士学位期末项目,我想创建一个OCR用于使用蟒蛇进行瓶子检查。我需要一些图像的文本识别的帮助。我是需要以更好的方式应用CV2操作,还是应该尝试其他方法? 我尝试对图像执行图像处理操作,并使用pytesseract识别字符。 使用我从这张照片中获得的以下代码: 到此: 然后转到这个: 锐化功能: def sharpen(img): sharpen
..
我已经训练tesseract使用终结点字体,但无论如何,我都无法让它识别0。我正在使用jTessEditor创建培训tif和盒子。即使在验证时,它也会将全0读作8。我有什么遗漏的吗? 这里是0的一个示例,它将其读取为8: 我使用以下参数: --psm 10 -c tessedit_char_whitelist=0123456789# --oem 3 -l terminus
..
我正在处理一个项目,在该项目中,我正在对标签上的文本进行OCR。我的工作是对图像进行倾斜,使其可用tesseract读取。 我一直在使用this approach,对图片进行灰度和阈值处理,获取黑色像素坐标,在其周围绘制minAreaRect,然后根据此矩形的倾斜角度校正倾斜。这适用于,但不适用于具有背景的图像,如所显示的图像。在那里,它计算的倾斜角度为0.0,并且不旋转图像。(预期结果:1
..
我想突出显示网站截图中的特定单词/句子。 截图之后,我使用pytesseract和cv2提取文本。它工作得很好,我可以获得有关它的文本和数据。 import pytesseract import cv2 if __name__ == "__main__": img = cv2.imread('test.png') img = cv2.cvtColor(img, cv2.
..
我已经实现了以下脚本,以便使用图像URL在单个和多个图像上执行OCR。 function doOCRALL() { var selected = SpreadsheetApp.getActiveSheet().getActiveRange().getValues().length; for (var i = 0; i
..
我有一组PIL图像,其中一些页面被正确旋转,而另一些页面的旋转接近180°。这意味着自动方向检测可能会失败,因为不是178°识别2°方向。 遗憾的是,Tesseract有时无法识别2°方向和178°之间的差异,因此在后一种情况下,输出完全错误。 简单的im.rotate(180)可以自动修复这个问题,但该步骤是手动的,我希望tesseract自动了解文本是否颠倒。 看一下一些方法,它们需要
..
我有一些文件包含一些扫描的收据,我需要使用OCR从其中提取文本。由于收据中打印的文字会在一段时间后淡出,因此收据中的某些文字不清晰,会影响OCR结果。 淡出单词的一些示例: 有什么方法可以恢复褪色的部分,以便我可以改善OCR结果? 我在OpenCV中尝试了图像阈值和图像平滑,但效果不是很理想。是否可以进一步处理该图像? 先取平均值,然后取高斯阈值 先是高斯模糊,然后是高斯阈值
..
有人知道如何设置Pytesseract的字符白名单吗?我希望它只输出A-z和0-9。这个是可能的吗?我有以下内容: img = Image.open('test.jpg') result = pytesseract.image_to_string(img, config='-psm 6') 我正在为%1获取其他字符,如/,所以我想限制可能的字符选项。 推荐答案 您可以使用以下
..
我想创建一个类似于用于裁剪文档的凸轮扫描仪的应用程序。 但我需要与我的两个映像相同的功能。 显示的第一张图像摄像机捕获的图像.. 第二个图像识别捕获的图像部分,如下所示.. 我研究得越来越多,但没有得到任何成果,所以我在这里问一下,有没有人做过这件事告诉我.. 谢谢 推荐答案 我认为您的问题是检测要扫描的对象。 像模式匹配或功能检测这样的对象检测机制
..
我正在尝试从图像中识别文本,然后将文本输出; 但是,此错误显示为: 回溯(最近一次呼叫): 文件“C:/Users/Benji的Beast/AppData/Local/Programs/Python/Python37-32/imageDet.py”,行41,位于 print(get_string(src_path+“cont.jpg”)) 文件“C:/Users/Benji的Beast/Ap
..
我的系统中有许多 PDF 文档,有时我注意到文档是基于图像的,没有编辑功能.在这种情况下,我进行 OCR 是为了在 Foxit PhantomPDF 中进行更好的搜索,您可以在多个文件中进行 OCR.我想找到我的所有基于图像的 PDF 文档. 我不明白 PDF 阅读器如何识别文档的 OCR 不是文本.这些读者必须访问某些字段.这也可以在终端中访问.这个答案给出了如何在线程检查PDF文件是否是
..
我已从 ABBYY 获得试用许可证并获得 iPhone 的试用 SDK.但我无法在我的设备上构建和调试项目.它给出了一个错误:“_OBJC_CLASS_$_CMocrManager",引用自: 该应用程序在模拟器中运行良好(示例中提供了一张图像). 请帮忙,我已附上截图. 解决方案 我已经联系了 abbyy mobile sdk 的技术支持,下面是关于内部版本号的回复:
..
我找到了一个可以识别手写数学方程式的网络应用程序: http://webdemo.visionobjects.com/equation.html?locale=default 我想知道是否有人知道实现此机制的应用程序或教程或开源项目,因为从这个 webapp 获取它真的很复杂. 注意:我只需要将画布中绘制的方程式翻译到输入文本框中即可. 解决方案 Tesseract OC
..
我是 HTML5+JS 的新手,我想使用 开发一个混合应用程序ocrad.js. 下面给出的代码,从 github 页面下载非常适合我(Chrome 32.0.1). 函数 OCRImage(图像){var canvas = document.createElement('can
..
我想阅读对象上的文字.但是 OCR 程序无法识别它.当我给小部分时,它可以识别.我必须将圆形文本转换为线性文本.我怎样才能做到这一点?谢谢. 解决方案 您可以将图像从笛卡尔坐标系转换为极坐标系,为OCR程序准备圆路径文本图像.这个函数 logPolar() 可以提供帮助. 以下是准备圆路径文本图像的一些步骤: 使用 HoughCircles() 找到圆的中心. 求平均值并做一
..