ocr相关内容

使用Pytesseract OCR识别具有表格结构的图像时的错误字符

我使用代码定位文本框并在它们周围创建一个矩形。 但是,即使文本框检测效果很好,如果我尝试定义存在的字符,我也可以在图像中的表格结构周围重建网格。 在每个矩形中,pytesseract不能很好地识别它们,并且不允许找到原始文本。 这是我的Python代码: import os import cv2 import imutils import argparse ..
发布时间:2020-10-21 18:35:09 Python

识别Talmud页面上的文本区域

我有一个类似这样的Talmud页面: 并且我想用 opencv 查找文本区域以获得这样的结果,即每个文本都将像这样: 在所附图像中,每个区域都用不同的颜色标记,并且文本带有数字,重要的是要识别 用眼睛做它确实很容易,文本之间传递的白色条纹,但是我尝试使用 opencv 来完成,但是我做不到。 在以下代码中我试着抓住所有字母,将它们变成黑色矩形, ,然后放大每个矩形,使其与 ..

Android:NullPointerException错误

我知道询问NullPointerException的答案很乏味,并且那里也有类似的问题.但是,我只是无法从其他问题中找到解决问题的方法. 我有2个课程: CreateContactActivityl.java: 将文本输出的意图传递给RegexOCR1.java RegexOCR1.java: 接收文本输出,将文本输出传递给此类中的方法 如logcat所述,该错 ..
发布时间:2020-08-27 01:41:13 Java开发

相机预览和OCR

我是android开发的新手-我正在使用Xamarin. 我试图编写一个应用程序来启动相机预览,然后不断扫描传入的帧中的文本(我使用的是NuGet的Xamarin.Tesseract). 换句话说,我不想让用户拍张照片然后进行OCR分析,而是希望他们仅将摄像机对准带有文字的纸,我将继续进行OCR分析,直到我检测到要搜索的特定文本为止),此时,我将向用户大加赞赏. 这是我到目前为止 ..
发布时间:2020-08-25 05:22:03 其他开发

AWS-Textract-Key-Value-Pair Java-线程"main"; java.lang.NullPointerException

我在Java Spring引导项目中使用AWS Textract.我已经设置了AWS CLI,并将SDK作为maven依赖项. 我已经编写了从C#转换为提取键和值对的Java代码,并且在成功提取了一些单词后收到以下错误消息 " AGENCYCUSTOMERID:FEIN(如果适用),MARITALSTATUS/CIVILUNION(如果适用),请确保保险代码BUSPRIMARYE-MA ..
发布时间:2020-07-29 20:46:27 Java开发

我想使用轮廓检测​​按从出现的顺序对从图像中提取的单词进行排序

我正在制作OCR,正在使用轮廓检测​​,我已经提取了单词并绘制了边界框,但是问题是当我裁剪单个单词时,它们没有按照排序的顺序排列.我已经尝试过 sorted_ctrs=sorted(ctrs, key=lambda ctr: cv2.boundingRect(ctr)[0] + cv2.boundingRect(ctr)[1] * im.shape[1] ) 已提取边界框的图像 这是从排序 ..
发布时间:2020-07-21 04:01:52 其他开发

使用tess4j从彩色图像中读取文本

我能够从单色图像中读取文本,但无法从彩色图像中读取文本.我将不胜感激... 解决方案 您可以使用阈值对位图/图像进行预处理,然后再向其提供库.然后它将是黑白的,并且重起应该很容易. ..
发布时间:2020-05-19 19:38:34 Java开发

如何为Google Tensorflow注意OCR创建定制的数据集?

我能够根据解决方案 是否应将所有图像写入单个TFRecord文件或 创建多个TFRecord文件 这取决于训练数据的大小,并影响并行预取以填充队列.我建议每个分片〜1000个样本(一个tfrecord文件,后缀总数为num,例如/path/to/my/dataset-00000-of-00512). "charset_filename"文件中应包含什么内容? 它是一个文本文 ..
发布时间:2020-05-19 19:38:31 Python

火车tesseract停止工作

我正在使用Serak Tesseract Trainer for Tesseract 3.0x.我添加了一个火车图像,然后来自jTessBoxEditor(一个Box Generator).当我按下Train Tesseract时,一个DOS命令提示我,就像训练图像一样,然后突然出现了: 正在阅读dos.bookmanoldstyle.exp0.tr ...字体ID = -1/0,样本ID上 ..
发布时间:2020-05-19 19:38:26 其他开发

如何从iPhone应用程序扫描事物

我想知道如何从iPhone摄像头扫描纸张,我需要稍后再读取纸张上的数据,我想存储数据... 有可能吗?? 请给我一个想法... 谢谢.. 解决方案 嗯,这很有可能. 我不确定如何做到这一点,但您应该一定要看看OCR. 尝试在正式的Google iPhone应用程序中查看Google Google,这实际上可以从您拍摄的照片上读取文本,即使是倾斜也可以. ..
发布时间:2020-05-19 19:38:23 移动开发

Tesseract-全线输出

我正在尝试使用Tesseract对少数几张桌子进行OCR.这些表具有以下格式: Item One name Item One category (Item description if any) Item Two name Item Two category (Item description if a ..
发布时间:2020-05-19 19:38:19 其他开发

Zinnia(手写识别)和PHP集成

任何人都可以提供有关如何将 zinnia (手识别系统)与常规php集成的说明或步骤吗?可以在此处找到示例. 谢谢. 解决方案 它显示为Thread-safe C/C++/Perl/Ruby/Python libraries,所以我想您不能在PHP中使用它. 针对具有 ..
发布时间:2020-05-19 19:38:13 PHP

如何从Python访问Tesseract的命令行?

我正在使用Python进行一些处理,并且需要使用Tesseract进行OCR.有没有办法可以从python输入以下内容: "tesseract --tessdata-dir/usr/share映像名输出库-l eng -psm 3" 以某种方式或等效方式进入命令行? 谢谢! 解决方案 请参见下面的示例. import subprocess p = subproce ..
发布时间:2020-05-19 19:38:10 其他开发