ocr - IT屋-程序员软件开发技术分享社区

Tesseract-OCR验证码：需要阅读文本

验证码-01 验证码-02 我已经应用了一些图像预处理。当我将此图像应用到pytesseract.image_to_string()时，它的结果很差，您能建议我一个更好的结果吗。推荐答案 Tesseract不是为中断验证码而设计的。Tesseract需要没有最少瑕疵的清晰图像。如果实现验证码，这是有原因的。与其破坏规则，不如联系站点管理员以达成合作协议，而不是违反 ..

发布时间：2022-08-12 14:55:41 opencv ocr tesseract captcha 其他开发

如何检测图像中是否包含ASCII字符？

我有一个图像数据集，我想过滤掉所有包含文本(ASCII字符)的图像。例如，我有一个可爱的狗狗形象：如您所见，右下角有一段文字&2003年5月18日，因此应将其过滤掉。经过一番研究，我发现了tesseractOCR。在python中，我有以下代码： # Attempt 1 img = Image.open('n02086240_1681.jpg') text = pytesse ..

发布时间：2022-04-12 13:27:52 python image-processing ocr tesseract python-tesseract Python

如何改进CAPCTHA解码的pytesseract功能？

我想从python中的图像中提取数字。为了做到这一点，我选择了pytesseract。当我尝试从图像中提取文本时，结果并不令人满意。我还检查了以下代码，并实现了与其他答案一起列出的所有技术。然而，它似乎表现不佳。示例图片：我的代码是： import cv2 as cv import pytesseract from PIL import Image import matplo ..

发布时间：2022-03-27 15:53:32 python opencv ocr tesseract python-tesseract Python

使用Python从扫描的pdf中提取PDF数据

我正在用tesseract OCR从扫描的pdf中提取数据，我能够提取数据，但精度不是很好。在很多地方，它显示错误的数据，所以我可以100%准确地获取数据。首先我将pdf转换为jpg格式，然后使用tesseract模块从图像中提取数据。 from PIL import Image import pytesseract text=(pytesseract.image_to_strin ..

发布时间：2022-03-27 15:50:42 python-3.x ocr python-tesseract pdfminer pdf-extraction 其他开发

如何在使用tesseract-4.0进行文本提取时保留图像中的所有空格？

我正在使用tesseract-ocr 4.0从图像中提取表格文本，并在保持数据对齐的同时将结果导出到Excel中。我希望在提取的表中保持图像中的所有空间不变。但OCR会跳过许多前导空格和尾随空格，并将其删除。我有一些图像，在某些位置，表中出现空格。我在tesseract中使用了保留空白选项，但OCR仍然跳过了很多空格。在使用OCR进行提取时，有没有办法检测或保留表中的所有空 ..

发布时间：2022-03-27 15:48:55 python deep-learning ocr whitespace tesseract Python

如何从图像中提取虚线文本？

我正在做我的学士学位期末项目，我想创建一个OCR用于使用蟒蛇进行瓶子检查。我需要一些图像的文本识别的帮助。我是需要以更好的方式应用CV2操作，还是应该尝试其他方法？我尝试对图像执行图像处理操作，并使用pytesseract识别字符。使用我从这张照片中获得的以下代码：到此：然后转到这个：锐化功能： def sharpen(img): sharpen ..

发布时间：2022-03-27 15:46:25 python opencv image-processing ocr python-tesseract Python

Tesseract OCR将斜杠0混淆为8

我已经训练tesseract使用终结点字体，但无论如何，我都无法让它识别0。我正在使用jTessEditor创建培训tif和盒子。即使在验证时，它也会将全0读作8。我有什么遗漏的吗？这里是0的一个示例，它将其读取为8：我使用以下参数： --psm 10 -c tessedit_char_whitelist=0123456789# --oem 3 -l terminus ..

发布时间：2022-03-27 15:44:18 python ocr tesseract Python

对带有背景的图像进行倾斜(Python)

我正在处理一个项目，在该项目中，我正在对标签上的文本进行OCR。我的工作是对图像进行倾斜，使其可用tesseract读取。我一直在使用this approach，对图片进行灰度和阈值处理，获取黑色像素坐标，在其周围绘制minAreaRect，然后根据此矩形的倾斜角度校正倾斜。这适用于，但不适用于具有背景的图像，如所显示的图像。在那里，它计算的倾斜角度为0.0，并且不旋转图像。(预期结果：1 ..

发布时间：2022-03-27 15:38:41 python opencv ocr tesseract python-tesseract Python

使用python突出显示图像中的特定文本

我想突出显示网站截图中的特定单词/句子。截图之后，我使用pytesseract和cv2提取文本。它工作得很好，我可以获得有关它的文本和数据。 import pytesseract import cv2 if __name__ == "__main__": img = cv2.imread('test.png') img = cv2.cvtColor(img, cv2. ..

发布时间：2022-03-27 15:36:28 python-3.x computer-vision ocr python-tesseract 其他开发

使用Google App脚本的Google Drive中的OCR图像

我已经实现了以下脚本，以便使用图像URL在单个和多个图像上执行OCR。 function doOCRALL() { var selected = SpreadsheetApp.getActiveSheet().getActiveRange().getValues().length; for (var i = 0; i ..

发布时间：2022-03-27 15:34:02 google-apps-script google-sheets ocr google-docs 其他开发

如何增强Tesseract的OCR自动文本旋转功能？

我有一组PIL图像，其中一些页面被正确旋转，而另一些页面的旋转接近180°。这意味着自动方向检测可能会失败，因为不是178°识别2°方向。遗憾的是，Tesseract有时无法识别2°方向和178°之间的差异，因此在后一种情况下，输出完全错误。简单的im.rotate(180)可以自动修复这个问题，但该步骤是手动的，我希望tesseract自动了解文本是否颠倒。看一下一些方法，它们需要 ..

发布时间：2022-03-27 15:28:38 python-imaging-library ocr tesseract python-tesseract 其他开发

收据中字符的褪色部分可以恢复吗？

我有一些文件包含一些扫描的收据，我需要使用OCR从其中提取文本。由于收据中打印的文字会在一段时间后淡出，因此收据中的某些文字不清晰，会影响OCR结果。淡出单词的一些示例：有什么方法可以恢复褪色的部分，以便我可以改善OCR结果？我在OpenCV中尝试了图像阈值和图像平滑，但效果不是很理想。是否可以进一步处理该图像？先取平均值，然后取高斯阈值先是高斯模糊，然后是高斯阈值 ..

发布时间：2022-03-27 15:23:10 python opencv image-processing ocr receipt Python

Pytesseract集字符白名单

有人知道如何设置Pytesseract的字符白名单吗？我希望它只输出A-z和0-9。这个是可能的吗？我有以下内容： img = Image.open('test.jpg') result = pytesseract.image_to_string(img, config='-psm 6') 我正在为%1获取其他字符，如/，所以我想限制可能的字符选项。推荐答案您可以使用以下 ..

发布时间：2022-03-27 15:20:00 python ocr tesseract python-tesseract Python

是否使用多个点和灵活的大小裁剪图像？

我想创建一个类似于用于裁剪文档的凸轮扫描仪的应用程序。但我需要与我的两个映像相同的功能。显示的第一张图像摄像机捕获的图像.. 第二个图像识别捕获的图像部分，如下所示.. 我研究得越来越多，但没有得到任何成果，所以我在这里问一下，有没有人做过这件事告诉我.. 谢谢推荐答案我认为您的问题是检测要扫描的对象。像模式匹配或功能检测这样的对象检测机制 ..

发布时间：2022-03-27 15:14:25 android opencv ocr crop 移动开发

(-215：断言失败)cv：：imread函数'；cv：：cvtColor'；中的！_src.Empty()

我正在尝试从图像中识别文本，然后将文本输出；但是，此错误显示为：回溯(最近一次呼叫)：文件“C：/Users/Benji的Beast/AppData/Local/Programs/Python/Python37-32/imageDet.py”，行41，位于 print(get_string(src_path+“cont.jpg”)) 文件“C：/Users/Benji的Beast/Ap ..

发布时间：2022-03-27 15:12:54 python ocr tesseract cv2 python-tesseract Python

我的系统中有许多 PDF 文档，有时我注意到文档是基于图像的，没有编辑功能.在这种情况下，我进行 OCR 是为了在 Foxit PhantomPDF 中进行更好的搜索，您可以在多个文件中进行 OCR.我想找到我的所有基于图像的 PDF 文档. 我不明白 PDF 阅读器如何识别文档的 OCR 不是文本.这些读者必须访问某些字段.这也可以在终端中访问.这个答案给出了如何在线程检查PDF文件是否是 ..

发布时间：2022-01-24 23:17:25 java python pdf debian ocr Java开发

尝试构建 ABBYY Mobile OCR SDK 示例代码时出现构建错误

我已从 ABBYY 获得试用许可证并获得 iPhone 的试用 SDK.但我无法在我的设备上构建和调试项目.它给出了一个错误:“_OBJC_CLASS_$_CMocrManager"，引用自: 该应用程序在模拟器中运行良好(示例中提供了一张图像). 请帮忙，我已附上截图. 解决方案我已经联系了 abbyy mobile sdk 的技术支持，下面是关于内部版本号的回复: ..

发布时间：2022-01-19 21:15:53 ios4 ocr abbyy 其他开发

<canvas> 上的 JavaScript 文本识别和 OCR

我找到了一个可以识别手写数学方程式的网络应用程序: http://webdemo.visionobjects.com/equation.html?locale=default 我想知道是否有人知道实现此机制的应用程序或教程或开源项目，因为从这个 webapp 获取它真的很复杂. 注意:我只需要将画布中绘制的方程式翻译到输入文本框中即可. 解决方案 Tesseract OC ..

发布时间：2022-01-17 11:34:19 javascript html5-canvas ocr text-recognition 前端开发

ocrad.js- OCR Javascript 库在将 HTML5 画布传递给 OCRAD() API 时抛出 Uncaught SecurityError

我是 HTML5+JS 的新手，我想使用开发一个混合应用程序ocrad.js. 下面给出的代码，从 github 页面下载非常适合我(Chrome 32.0.1). 函数 OCRImage(图像){var canvas = document.createElement('can ..

发布时间：2022-01-17 11:30:48 javascript html5-canvas ocr filereader 前端开发

使用 OCR 读取圆形文本

我想阅读对象上的文字.但是 OCR 程序无法识别它.当我给小部分时，它可以识别.我必须将圆形文本转换为线性文本.我怎样才能做到这一点?谢谢. 解决方案您可以将图像从笛卡尔坐标系转换为极坐标系，为OCR程序准备圆路径文本图像.这个函数 logPolar() 可以提供帮助. 以下是准备圆路径文本图像的一些步骤: 使用 HoughCircles() 找到圆的中心. 求平均值并做一 ..

发布时间：2022-01-14 15:31:35 opencv text alignment ocr geometry 其他开发

ocr相关内容