ocr 第9页 - IT屋-程序员软件开发技术分享社区

使用Pytesseract OCR识别具有表格结构的图像时的错误字符

我使用代码定位文本框并在它们周围创建一个矩形。但是，即使文本框检测效果很好，如果我尝试定义存在的字符，我也可以在图像中的表格结构周围重建网格。在每个矩形中，pytesseract不能很好地识别它们，并且不允许找到原始文本。这是我的Python代码： import os import cv2 import imutils import argparse ..

发布时间：2020-10-21 18:35:09 python opencv ocr detection python-tesseract Python

如何以表格格式从发票中提取数据

我正在尝试使用计算机视觉从pdf /图像发票中提取数据。为此，我使用了基于ocr的pytesseract。这是示例发票您可以在下面找到相同的代码 import pytesseract img = Image.open（“ invoice-sample.jpg”）文字= pytesseract.image_to_string（img ） print（tex ..

发布时间：2020-10-07 19:01:35 python-3.x opencv computer-vision ocr python-tesseract 其他开发

识别Talmud页面上的文本区域

我有一个类似这样的Talmud页面：并且我想用 opencv 查找文本区域以获得这样的结果，即每个文本都将像这样：在所附图像中，每个区域都用不同的颜色标记，并且文本带有数字，重要的是要识别用眼睛做它确实很容易，文本之间传递的白色条纹，但是我尝试使用 opencv 来完成，但是我做不到。在以下代码中我试着抓住所有字母，将它们变成黑色矩形，，然后放大每个矩形，使其与 ..

发布时间：2020-10-07 18:48:22 opencv image-processing computer-vision ocr image-segmentation 其他开发

如何使用ctypes.util.find_library导入AWS Lambda(python)中的.so库?

我在想什么我在Lambda上使用的(OCRMYPDF)python软件包需要leptonica库 liblept.so.5 .在隔离导入代码时，我发现问题出在 find_library('lept').打印结果返回None. from ctypes.util import find_library def lambda_handler(event, context): lib ..

发布时间：2020-09-15 19:50:41 python aws-lambda ocr ctypes Python

Android:NullPointerException错误

我知道询问NullPointerException的答案很乏味，并且那里也有类似的问题.但是，我只是无法从其他问题中找到解决问题的方法. 我有2个课程: CreateContactActivityl.java: 将文本输出的意图传递给RegexOCR1.java RegexOCR1.java: 接收文本输出，将文本输出传递给此类中的方法如logcat所述，该错 ..

发布时间：2020-08-27 01:41:13 java android regex android-intent ocr Java开发

相机预览和OCR

我是android开发的新手-我正在使用Xamarin. 我试图编写一个应用程序来启动相机预览，然后不断扫描传入的帧中的文本(我使用的是NuGet的Xamarin.Tesseract). 换句话说，我不想让用户拍张照片然后进行OCR分析，而是希望他们仅将摄像机对准带有文字的纸，我将继续进行OCR分析，直到我检测到要搜索的特定文本为止)，此时，我将向用户大加赞赏. 这是我到目前为止 ..

发布时间：2020-08-25 05:22:03 xamarin xamarin.android android-camera ocr tesseract 其他开发

如何将Amazon Textract与PDF文件一起使用

我已经可以使用textract但可以使用JPEG文件.我想将其与PDF文件一起使用. 我有下面的代码: import boto3 # Document documentName = "Path to document in JPEG" # Read document content with open(documentName, 'rb') as document: ima ..

发布时间：2020-08-23 23:14:35 amazon-web-services ocr text-extraction amazon-textract 其他开发

AWS-Textract-Key-Value-Pair Java-线程"main"； java.lang.NullPointerException

我在Java Spring引导项目中使用AWS Textract.我已经设置了AWS CLI，并将SDK作为maven依赖项. 我已经编写了从C#转换为提取键和值对的Java代码，并且在成功提取了一些单词后收到以下错误消息 " AGENCYCUSTOMERID:FEIN(如果适用)，MARITALSTATUS/CIVILUNION(如果适用)，请确保保险代码BUSPRIMARYE-MA ..

发布时间：2020-07-29 20:46:27 java c# amazon-web-services ocr aws-textract Java开发

我想使用轮廓检测按从出现的顺序对从图像中提取的单词进行排序

我正在制作OCR，正在使用轮廓检测，我已经提取了单词并绘制了边界框，但是问题是当我裁剪单个单词时，它们没有按照排序的顺序排列.我已经尝试过 sorted_ctrs=sorted(ctrs, key=lambda ctr: cv2.boundingRect(ctr)[0] + cv2.boundingRect(ctr)[1] * im.shape[1] ) 已提取边界框的图像这是从排序 ..

发布时间：2020-07-21 04:01:52 sorting opencv ocr contour bounding-box 其他开发

使用GNU并行将两个命令组合用于OCR项目

我想编写一个脚本，该脚本在OCR pdfs上运行命令，该命令会在写入文本文件后删除生成的图像. 我要组合的两个命令如下. 此命令创建文件夹，从每个PDF中提取pgm并将其添加到每个文件夹中: time find . -name \*.pdf | parallel -j 4 --progress 'mkdir -p {.} && gs -dQUIET -dINTERPOLATE - ..

发布时间：2020-05-25 05:10:35 pdf parallel-processing ocr tesseract pgm 其他开发

使用tess4j从彩色图像中读取文本

我能够从单色图像中读取文本，但无法从彩色图像中读取文本.我将不胜感激... 解决方案您可以使用阈值对位图/图像进行预处理，然后再向其提供库.然后它将是黑白的，并且重起应该很容易. ..

发布时间：2020-05-19 19:38:34 java ocr tesseract Java开发

如何为Google Tensorflow注意OCR创建定制的数据集?

我能够根据解决方案是否应将所有图像写入单个TFRecord文件或创建多个TFRecord文件这取决于训练数据的大小，并影响并行预取以填充队列.我建议每个分片〜1000个样本(一个tfrecord文件，后缀总数为num，例如/path/to/my/dataset-00000-of-00512). "charset_filename"文件中应包含什么内容? 它是一个文本文 ..

发布时间：2020-05-19 19:38:31 python tensorflow ocr Python

从网址列表中筛选图像并将结果存储在电子表格中

您好，我有一个包含数字的图像URL列表，我想对其进行OCR并将结果存储在Google电子表格中我发现这些Google脚本可用于ocr图片 1- https://gist.github.com/tagplus5/07dde5ca61fe8f42045d 2- https://ctrlq.org/code/20128 -extract-text-from-image-ocr 但是我不知 ..

发布时间：2020-05-19 19:38:28 google-apps-script google-drive-api ocr 其他开发

我正在使用Serak Tesseract Trainer for Tesseract 3.0x.我添加了一个火车图像，然后来自jTessBoxEditor(一个Box Generator).当我按下Train Tesseract时，一个DOS命令提示我，就像训练图像一样，然后突然出现了: 正在阅读dos.bookmanoldstyle.exp0.tr ...字体ID = -1/0，样本ID上 ..

发布时间：2020-05-19 19:38:26 ocr tesseract 其他开发

如何从iPhone应用程序扫描事物

我想知道如何从iPhone摄像头扫描纸张，我需要稍后再读取纸张上的数据，我想存储数据... 有可能吗?? 请给我一个想法... 谢谢.. 解决方案嗯，这很有可能. 我不确定如何做到这一点，但您应该一定要看看OCR. 尝试在正式的Google iPhone应用程序中查看Google Google，这实际上可以从您拍摄的照片上读取文本，即使是倾斜也可以. ..

发布时间：2020-05-19 19:38:23 iphone objective-c ocr 移动开发

Tesseract-全线输出

我正在尝试使用Tesseract对少数几张桌子进行OCR.这些表具有以下格式: Item One name Item One category (Item description if any) Item Two name Item Two category (Item description if a ..

发布时间：2020-05-19 19:38:19 ocr tesseract 其他开发

在R中在pdf上执行ocr时出错

发布时间：2020-05-19 19:38:17 r pdf ocr tesseract lapply 其他开发

Zinnia(手写识别)和PHP集成

任何人都可以提供有关如何将 zinnia (手识别系统)与常规php集成的说明或步骤吗?可以在此处找到示例. 谢谢. 解决方案它显示为Thread-safe C/C++/Perl/Ruby/Python libraries，所以我想您不能在PHP中使用它. 针对具有 ..

发布时间：2020-05-19 19:38:13 php ocr handwriting PHP

如何从Python访问Tesseract的命令行?

我正在使用Python进行一些处理，并且需要使用Tesseract进行OCR.有没有办法可以从python输入以下内容: "tesseract --tessdata-dir/usr/share映像名输出库-l eng -psm 3" 以某种方式或等效方式进入命令行? 谢谢！解决方案请参见下面的示例. import subprocess p = subproce ..

发布时间：2020-05-19 19:38:10 ocr tesseract 其他开发

WindowsError:[错误2]系统找不到为pytesseract指定的文件

我正在尝试使用pytesseract进行OCR，但出现Windows错误.请帮助. from PIL import Image from pytesseract import image_to_string import matplotlib.pyplot as plt 加载图像 im = Image.open('image_112472.jpg') # the second on ..

发布时间：2020-05-19 19:38:08 python python-2.7 ocr Python

ocr相关内容