ocr相关内容

如何提高OCR准确率?

我有 2 张图片,如下所示.A.png 被 tesseract 完美读取,但 B.png 的准确性非常差,即使 B.png 与 A.png 相似.我怎样才能提高准确性?我不知道从哪里开始调试? A.png B.png 运行 OCR # tesseract -v超立方体 4.1.1-rc2-22-g08899 # tesseract A.png stdout -l jpn ..
发布时间:2021-06-12 18:36:33 其他开发

谷歌云视觉api-OCR

我想使用来自谷歌云视觉 API 的图像 (OCR) 的文本检测.但我不知道如何从 C# 中获取订阅密钥以及如何在 C# 中进行身份验证和调用.有人可以告诉我一步一步的程序来做到这一点.顺便说一句,我很新. 解决方案 我觉得这个问题有点混乱,所以让我退后一步,尝试涵盖在使用 Cloud Vision API 时与身份验证有关的最重要的事情. 首先,该文档对如何向 Cloud Visio ..
发布时间:2021-06-12 18:36:30 C#/.NET

使用配置文件对 Tesseract 3.02 的字符置信度

如何获得检测到的每个字符的 % 置信度?通过四处搜索,我发现您应该将 save_blob_choices 设置为 T.所以我将它添加到 tessdata/configs 中的 hocr 配置文件中的一行,并用它调用 tesseract.这就是我在生成的 html 文件中得到的全部内容: ..
发布时间:2021-06-12 18:36:26 其他开发

为什么 Pytesseract 不能识别黑底白字?

我有很多像下面这样的图像,我需要使用 pytesseract 来抓取白色文本: 我使用以下代码,但结果并不令人印象深刻: 导入pytesseract从 PIL 导入图像pytesseract.pytesseract.tesseract_cmd = 'C:/Program Files (x86)/Tesseract-OCR/tesseract'im = Image.open('topLine ..
发布时间:2021-06-12 18:36:23 Python

如何在Python中使用tesseract ocr获取结构格式中的信息?

我使用的是 Ubuntu. 这是我从网上得到的图片. 我关心的是获取图像中格式化的数据 并将其转储到文本文件中(必须保持位置(准确度为 95-97%)) 我正在使用 tesseract-ocr 几乎相同的问题在这里 我的代码-: 导入 cv2导入 pytesseract从 pytesseract 导入输出将 numpy 导入为 npimg = cv2.imre ..
发布时间:2021-06-12 18:36:20 Python

选择使用 Tesseract OCR 提取的文本部分

我在 R 中使用最新的 Tesseract OCR 引擎从几张图像中提取文本.它工作得很好,我对结果很满意.问题是我不想要全文,只想要一部分,但我不知道如何提取. 代码是这样的: library("tesseract")图书馆(“pdftools")图书馆(“魔术师")mypdfFile ..
发布时间:2021-06-12 18:36:17 其他开发

Tesseract OCR:解析表格单元格

我正在使用 cmd 中的 Tesseract-OCR v4.0.0 (alpha?) 从下表的 png 中提取文本: 我想让 Tesseract-OCR 解析一个单元格中的内容,然后再转到下一个单元格.我不想转到“行"中的下一个单词. 预期: ...约翰史密斯 2017 年 3 月 7 日芝加哥密尔沃基底特律太平洋... 实际: ...约翰史密斯 2017 年 3 月 ..
发布时间:2021-06-12 18:36:08 其他开发

Tesseract OCR 如何改善结果?

我在使用 Tesseract 时遇到了困难,有没有办法提高准确性?如果需要,我如何为自己训练? 我唯一要做的就是阅读以下字符,XYZ:-0123456789就是这样!图片总是那样. 谢谢! 解决方案 Tesseract 4.00alpha 与您的图像的输出是 $ tesseract ICKcj.png - -l eng*:4606 是;4809 Z;698警告.无效的分辨率 ..
发布时间:2021-06-12 18:36:05 其他开发

Tesseract OCR 水平读取而不是垂直读取 C#

我们有一个 C# .Net 应用程序,它使用 Tesseract 对 .tiff 文件进行光学字符识别 (OCR).这是一个例子: 然后我们将数据输出到文本文件.但是,Tesseract 以垂直方式读取数据.在我的示例图像中,它将 tiff 读取为两列数据,并且数据是从 Tesseract 输出的数据,如下所示: 类型:日期:地址:城市:状态:所有者:业主类型:面积:抵押:123452 ..
发布时间:2021-06-12 18:35:59 C#/.NET

使用 OCR 识别上标字符

我已经开始了一个简单的项目,它必须获得一个包含带有上标的文本的图像,然后通过使用 OCR(目前我正在使用 tesseract)它必须识别上标字符 + 普通字符. 例如,我们有一个化学方程式,例如 Cl²,但是当我使用 tesseract 识别它时,它给了我 Cl2(全部在一行中). 那么,这个问题的解决方案是什么?有没有其他可以读取上标的OCR API? 解决方案 非常好的问题 ..
发布时间:2021-06-12 18:35:56 其他开发

使tesseract仅识别数字

我正在尝试改进我为读取我正在使用的某个图像的布局而制作的 OCR 程序.现在,我希望我的 OCR 程序只能识别数字 0-9. 我尝试按照问题中的解决方案进行操作: tesseract 正在寻找的限制字符 但是我被困在我必须将tesseract称为: tesseract input.tif 输出nobatch字母 这去哪儿了? 解决方案 我前段时间在 SO 中发布了一些 ..
发布时间:2021-06-12 18:35:53 Python

Tesseract - 错误 net.sourceforge.tess4j.Tesseract - null

创建了一个使用 Tesseract 的 java 应用程序,以便将给定的图像或 pdf 转换为字符串格式,在我的机器上运行它作为使用 junit 的单元测试时,它运行良好,但在运行完整系统时,这是一个 restFul API由接收图像并运行 Tesseract 的 tomcat 运行它给我以下错误: 23:22:36.511 [http-nio-9999-exec-3] 错误net.sour ..
发布时间:2021-06-12 18:35:50 Java开发

如何从包含表格数据的图像中提取数据?

我正在使用 pytesseract、pillow、cv2 对图像进行 OCR 并获取图像中的文本.由于我输入的是扫描的 PDF 文档,我首先将其转换为图像 (JPEG) 格式,然后尝试提取文本.我只走了一半.输入是一个表格,没有显示标题,因为标题有黑色背景.我也尝试过 getstructuringelement 但无法想出办法.这是我到目前为止所做的- 导入 cv2导入操作系统将 numpy 导 ..
发布时间:2021-06-12 18:35:46 Python

从图像中删除 OCR 字(OpenCV,Python)

所以,从我可以开始的.. 我正在使用 OCR.该脚本非常适合我的需要.它可以准确地检测单词,这对我来说还可以. 这是结果:100% 准确率附加图像. from PIL 导入图片导入pyocr.builders导入操作系统os.putenv("TESSDATA_PREFIX", "C:\\Program Files (x86)\\Tesseract-OCR")工具 = pyocr. ..
发布时间:2021-06-12 18:35:41 Python

如何使用 OCR 检测图像中的下标数字?

我通过 pytesseract 绑定将 tesseract 用于 OCR.不幸的是,我在尝试提取包含下标样式数字的文本时遇到了困难 - 下标数字被解释为一个字母. 例如在基本图像中: 我想将文本提取为“CH3",即我不担心知道数字 3 是图像中的下标. 我使用 tesseract 对此的尝试是: 导入 cv2导入 pytesseractimg = cv2.imread('tes ..
发布时间:2021-06-12 18:35:38 Python

用于 OCR 的场景文本图像超分辨率

我正在研究 OCR 系统.我在识别 ROI 内的文本时面临的一个挑战是 抖动 或 运动效果 镜头或文本由于角度位置而无法聚焦.请考虑以下演示示例 如果您注意到文本(例如标记为红色),在这种情况下,OCR 系统无法正确识别文本.但是,这种情况也可能在没有角度拍摄的情况下出现,其中图像太模糊以至于 OCR 系统无法识别或部分识别文本.有时它们模糊或有时非常低分辨率或像素化.例如 我们尝试过 ..

具有表格或行的文档的 Tesseract OCR 文本顺序

我正在使用 Tesseract OCR 将扫描的 PDF 转换为纯文本.总体而言,它非常有效,但我对扫描文本的顺序有疑问.当看起来更自然的方式是逐行扫描时,带有表格数据的文档似乎是逐列向下扫描的.一个非常小的例子是: 这是A列第1行这是B列第1行这是C列第1行这是A列第2行 这是B列第2行 这是C列第2行 正在产生以下文本: 这是A列第1行这是 A 列第 2 行这是 B 列第 1 行这是 B ..
发布时间:2021-06-12 18:35:32 其他开发

通过 pytesseract & 提高文本识别的准确性PIL

所以我想从图像中提取文本.并且由于图像的质量和大小不佳,因此给出的结果不准确.我尝试使用 PIL 进行了一些增强和其他操作,但这只会降低图像质量. 有人可以建议对图像进行一些增强以获得更好的结果.图片示例: 解决方案 在提供的图像示例中,文本在视觉上的质量非常好,所以问题是 OCR 给出的结果不准确是怎么回事? 为了说明这个答案的进一步文本中给出的结论,让我们运行给定的图像 ..

Google Cloud Vision API 是否检测 OCR 文本中的格式,如粗体、斜体、字体名称(黑体或新罗马)等?

敏捷的棕色狐狸跳过懒惰的狗 在这种情况下,假设也有不同的字体系列,cloud VIsion API 可以检测到这一点.或者任何其他 OCR API 都能干净地检测到这一点.Tesseract 有能力,但它太不准确了. 解决方案 谷歌云视觉 API 是否检测 OCRed 文本中的格式,如粗体、斜体、字体名称(helvetica 或 times new roman)等? 不幸的 ..
发布时间:2021-06-12 18:35:25 其他开发