tesseract相关内容

PHP TesseractOCR exec 命令问题

我已经从 mac 终端安装了 TesseractOCR.当我从终端运行以下命令时,它正在工作. tesseract "hello.png"/Applications/MAMP/tmp/php/987051047 但是相同的命令在 中不起作用 exec("tesseract "hello.png"/Applications/MAMP/tmp/php/987051047") 完整 ..
发布时间:2021-09-06 18:36:10 PHP

Tesseract ocr 返回空字符串

我正在为 android 构建一个 OCR 应用程序,我使用 tesseract ocr 引擎.不知何故,每次我在照片上使用引擎时,它都会返回一个空文本.这是我的代码: public String detectText(Bitmap bitmap) {TessBaseAPI tessBaseAPI = 新 TessBaseAPI();String mDataDir = setTessData() ..
发布时间:2021-09-06 18:36:08 移动开发

如何在 bash 脚本中检查 tesseract 的输出?

我在 bash 脚本中运行一个循环并将 png 文件传递​​给 tesseract 以读取图像文件的文本.如果 tesseract ocr 的输出显示 Empty page!! 或什么都没有,那么我希望循环继续下一个图像.如果它确实包含文本,那么我想将输出存储在文本文件中. 这是我的基本脚本的样子, for i in {1..100}做tesseract 文件-${i}.png stdou ..
发布时间:2021-09-06 18:36:05 服务器开发

Android Tesseract 错误.数据文件未在

我正在学习使用 NDK 和 opencv 的 android. 我成功使用 ndk.所以我得到了可用的数据(我的意思是数据是由 canny 完成的.) 当我使用 Tesseract 时, 在/storage/emulated/0/tesseract/tessdata/eng.traineddata 中找不到数据文件 发生此错误. 我已经检查过adroid/app/sr ..
发布时间:2021-09-06 18:35:59 移动开发

无法让 tesseract 在 python 上工作

当我尝试在 jupyter notebook 或 pycharm 上使用 tesseract 运行代码时遇到了一些问题.我怀疑是 Windows 7 上的安装问题,但我不确定我做错了什么. 所以我尝试了很多不同的方法,从 pip install tesseract 和 pytesseract 到安装 tesseract OCR(起初我认为这只是一个库,这就是我搞砸了顺序的原因),如下所示:h ..
发布时间:2021-09-06 18:35:53 Python

使用 Tesseract 从小图像中读取日期

我有一组相当小的包含日期的图像.尺寸可能有问题,但我会说质量还可以.我已按照指南 向引擎提供我所能提供的最清晰的图像.调整大小后,应用过滤器,大量试验和错误等.我想出了一个几乎可以正确阅读的图像.我在下面举了一个例子: 现在,这读作 “9 MAR 2021\n\x0c.不错,但是第一个 2 读作 ".在这一点上,我认为我滥用了 Tesseract 的部分功能.毕竟,我知道它应该期待什么,即" ..
发布时间:2021-09-06 18:35:50 其他开发

阅读条形码pytesseract python下方的文本

我正在尝试获取图像中条形码下方的数字.我已经对其他一些图像尝试了相同的代码并且工作正常但不适用于该图像这是图片 这是到目前为止的代码 def readNumber():图像 = cv2.imread(sTemp)灰色 = cv2.cvtColor(图像,cv2.COLOR_BGR2GRAY)模糊 = cv2.GaussianBlur(gray, (3,3), 0)thresh = cv2. ..
发布时间:2021-09-06 18:35:43 Python

为什么在通过 Tesseract 获取文本时会得到额外的字符(箭头符号)?

每当我获取任何语言的文本时,输出都会有这个额外的字符(箭头符号),它在图像中没有.我想了解它为什么存在,以及如何在输出中避免这些额外的字符. 解决方案 这很可能是隐式页面分隔符 \f,记事本显示为那个箭头.有关该主题的一些详细信息,请参阅:Tesseract 4.0.0 输出的txt 使用了哪些页面分隔符? 您可以尝试将 -c page_separator="" 添加到您的配置中.你 ..
发布时间:2021-09-06 18:35:40 其他开发

无法在 Mac 上安装 Tesseract-OCR

我正在尝试使用 pytesseract 在 python 2.7.14 中制作 OCR 程序.当我运行我的代码时: from PIL import Image导入 pytesseract打印(pytesseract.image_to_string(Image.open('test.png'))) 我收到错误: IOError: [Errno 2] 没有这样的文件或目录:'test.png' ..
发布时间:2021-09-06 18:35:34 其他开发

多尺度模板匹配与文本检测

我正在尝试使用 PyAutoGUI 自动导航网站以获取数据和下载文件以检测图像和按钮,但在其他人的计算机上使用它时遇到问题.在我看来,匹配文本图像是这里最大的障碍. 我怀疑问题出在缩放和分辨率上,所以我尝试使用多尺度模板匹配,但我发现使用我放大的模板根本不会创建匹配.使用我缩小规模的模板也无济于事,因为它要么找不到任何匹配项,要么即使在 0.8-0.9 的小范围置信度下也找不到错误的匹配项. ..
发布时间:2021-09-06 18:35:31 Python

有没有办法在 venv/web 服务器中安装 Tesseract OCR?

我制作了一个执行 OCR 的 Python 脚本,然后我回收了该脚本并使用 Flask 制作了一个网络应用程序.Web 应用程序及其库位于 virtualenv 中,但该应用程序使用的是安装在操作系统 (Windows) 中的 Tesseract OCR.我一直在本地服务器上测试它.现在是部署的时候了,我不知道如何在venv中安装Tesseract,也不知道是否可以将其安装在服务器上.我不知道我说 ..
发布时间:2021-09-06 18:35:24 Python

tesseract 训练新字体失败

我能够安装 tesseract 并训练新字体 我已按照 http 中提到的所有步骤进行操作://michaeljaylissner.com/blog/adding-new-fonts-to-tesseract-3-ocr-engine 现在我正在测试训练数据,但是当我运行命令时出现以下错误 tesseract eng.digital.exp0.tif ./output.txt -l ..
发布时间:2021-09-06 18:35:18 其他开发

tesseract (v3.03) 输出为 PDF

为什么会返回这个错误? root@amd-3700-2gb ~/ocr_test # tesseract -l dan pdf.png out pdfTesseract Open Source OCR Engine v3.03 with Leptonica打开数据文件/usr/local/share/tessdata/osd.traineddata 时出错请确保 TESSDATA_PREFIX ..
发布时间:2021-09-06 18:35:16 服务器开发

无法使用 Tesseract 3.0.2.02 存档为 WIndows 编译 Tesseract API 示例

我正在考虑使用 Tesseract 来处理 PDF 文件,因此我想使用该库而不是外部可执行文件. 我首先下载了完整的 Tesseract 源代码并考虑构建它.遗憾的是,标准源没有任何方法可以在非 Linux 平台上构建,在我的情况下是 Windows.有这样做的方法,我看了那些. 首先,VS2008 版本没有.我知道它需要 Leptonica,但我想我会在之后解决这个问题并尝试构建现有 ..
发布时间:2021-09-06 18:35:10 其他开发

Tesseract OCR 执行哪些预处理操作?

我找不到详细的文档,也没有浏览源代码的感觉.例如,如果 Tesseract 引擎已经完成了精明的边缘检测,我不想重做. 解决方案 本文档提供了引擎的概述:https://github.com/tesseract-ocr/docs/blob/master/tesseracticdar2007.pdf 所以看起来你不需要实现canny边缘检测. Tesseract 在处理之前使用 ..
发布时间:2021-09-06 18:35:07 其他开发