ocr相关内容

在android中的onPreviewFrame期间转换YUV-> RGB(图像处理)-> YUV?

我正在使用 SurfaceView 捕获图像并在 public void onPreviewFrame4(byte[] data, Camera camera) 中获取 Yuv Raw 预览数据 我必须在 onPreviewFrame 中执行一些图像预处理,所以我需要将 Yuv 预览数据转换为 RGB 数据而不是图像预处理并返回到 Yuv 数据. 我使用这两个函数将 Yuv 数据编码和解 ..
发布时间:2021-11-27 15:20:26 移动开发

Java OCR 实现

这主要只是出于好奇,但是否有纯 Java 中的任何 OCR 实现?我很好奇这将如何在 Java 中执行,而 OCR 总体上让我感兴趣,所以我很想看看它是如何用我完全理解的语言实现的.自然,这将要求实现是开源的,但我仍然对专有解决方案感兴趣,因为我至少可以检查在这种情况下的性能. 我见过一些可以在 Java 中使用的(比如 Asprise),但它没有似乎这些是纯 Java 实现……有吗? ..
发布时间:2021-11-25 14:21:25 Java Web开发

自动保存分割结果 - Matlab 阿拉伯语 OCR

完整的分割代码: % 预处理 + 分割%//Soumyadeep Sinha 的原始分割代码,Ana 进行了几次修改//% 将每个单独的分段字符保存为一个文件函数 [s] = seg (a)myFolder = 'D:\1.Thesis FINISH!!!\Simulasi I\Segmented Images';% a = imread('adv1.png');% 二值化 %级别 = gray ..
发布时间:2021-11-17 01:22:03 其他开发

阿拉伯语开源 OCR 库

我一直在寻找一个 OCR 库 - 最好是开源的 - 我可以在一些阿拉伯语 pdf 上使用它.谷歌搜索它没有产生任何有用的结果.我想知道是否有人知道可以添加阿拉伯语支持的相关 OCR 库,甚至是适用于相关语言(波斯语和乌尔都语可能相关)的 OCR 库. 任何有关如何解决此问题的一般建议将不胜感激. 解决方案 从 3.01 版开始Tessaract-ocr 现在支持阿拉伯语 ..
发布时间:2021-11-17 01:19:35 其他开发

USPS API - 创建标签后检索跟踪号 C#

我已经能够成功地使用 USPS API 创建发货标签.返回的 XML 为我提供了一个交付确认号,但它没有返回跟踪号.跟踪号码是我真正需要的.我用过 (https://www.usps.com/business/web-tools-apis/delivery-confirmation-domestic-shipping-label-api.pdf)作为我如何成功创建标签的基础,但没有地方可以它提到了 ..
发布时间:2021-11-15 04:23:04 其他开发

在 tesseract C++ API 中禁用字典辅助 OCR

我有一个使用 tesseract API 对技术数据表进行 OCR 处理的应用程序.我是这样初始化的: tesseract::TessBaseAPI tess;tess.Init(NULL, "eng", tesseract::OEM_TESSERACT_ONLY); 然而,即使使用了这样的自定义白名单 tess.SetVariable("tessedit_char_blacklist", ..
发布时间:2021-11-15 03:41:04 其他开发

在 Android 上训练 Tesseract

我正在使用 tess-two 库在 Android 上进行 OCR 识别.我想在 Android 上创建训练数据.我遵循了这个 link 并在 linux 系统上成功创建了训练数据.如何使用 tess-two 或任何其他库在 Android 上做同样的事情? 解决方案 适用于 Android 的 tess-two 库使用与在普通 Linux 系统上运行相同的 Tesseract 代码和相同 ..
发布时间:2021-11-15 03:36:19 其他开发

使用谷歌视觉 OCR API 从特定图像位置提取数据

我正在使用 Googles Vision OCR API 尝试从图像中提取 2 种类型的数据 1) 文本框中的手写文本;下面用红色圆圈标记,2) 勾选或复选框中的“x";下面用绿色圆圈标记.我将把这些数据输入到数据库中,所以我需要为这两种类型的数据返回一个字符串 目前,当我将此图像传递到 API 时,我得到一个包含所有数据的字符串: 中学学习学生对计算机的看法 LO 13.您的家庭成员 ..
发布时间:2021-11-15 03:10:45 其他开发

如何从不可搜索的pdf中检测可搜索的pdf?

我有一堆 pdf 文件,有些是可搜索的常规 pdf 文件,有些是不可搜索的某些文档的扫描版本.我想提取每个pdf的内容.要提取常规 pdf 的内容,我使用 Apache Tika 并从我使用的不可搜索的内容中提取内容 tesseract-ocr.但是我需要区分哪个pdf是nornal pdf,哪个不是.有没有办法做到这一点? 解决方案 这对你有帮助, public static bool ..
发布时间:2021-11-14 23:45:02 其他开发

无法使用 TesseractOCRConfig Apache Tika 提取扫描的 pdf

我的 pdf 包含扫描图像,我想从中提取文本. 我的尝试:我尝试使用 AutoDetectParsers 但没有输出. 我遵循了 Apache Tika 提取中提供的解决方案扫描的 PDF 文件以及 https://issues.apache 的 Apache Tika Jira.org/jira/browse/TIKA-1729 但得到空字符串没有任何错误. 我的配置:Win ..
发布时间:2021-11-14 23:44:44 其他开发

Apache Tika 提取扫描的 PDF 文件

我在使用 Apache TIKA(1.10 版)时遇到了一些问题.我得到了一些 PDF 文件,它们只是扫描的纸片.这意味着每个页面只是一个图像.我的目标是无论如何都要提取 PDF 文件的文本. 我的 tesseract 设置正确,提取 JPG 和 PNG 文件就像一个魅力.我正在使用的代码看起来像这样(不要介意缺少的异常处理): public String extractText(Inpu ..
发布时间:2021-11-14 23:43:31 其他开发

Tesseract ocr 返回空字符串

我正在为 android 构建一个 OCR 应用程序,我使用 tesseract ocr 引擎.不知何故,每次我在照片上使用引擎时,它都会返回一个空文本.这是我的代码: public String detectText(Bitmap bitmap) {TessBaseAPI tessBaseAPI = 新 TessBaseAPI();String mDataDir = setTessData() ..
发布时间:2021-09-06 18:36:08 其他开发

使用 Tesseract 从小图像中读取日期

我有一组相当小的包含日期的图像.尺寸可能有问题,但我会说质量还可以.我已按照指南 向引擎提供我所能提供的最清晰的图像.调整大小后,应用过滤器,大量试验和错误等.我想出了一个几乎可以正确阅读的图像.我在下面举了一个例子: 现在,这读作 “9 MAR 2021\n\x0c.不错,但是第一个 2 读作 ".在这一点上,我认为我滥用了 Tesseract 的部分功能.毕竟,我知道它应该期待什么,即" ..
发布时间:2021-09-06 18:35:50 其他开发

tesseract (v3.03) 输出为 PDF

为什么会返回这个错误? root@amd-3700-2gb ~/ocr_test # tesseract -l dan pdf.png out pdfTesseract Open Source OCR Engine v3.03 with Leptonica打开数据文件/usr/local/share/tessdata/osd.traineddata 时出错请确保 TESSDATA_PREFIX ..
发布时间:2021-09-06 18:35:16 其他开发

在tesseract OCR参数中定义多列?

我在每页包含 6 列的历史报纸上使用 OCR.目前我使用 FineReader 并为每列定义文本块.我想使用 Tesseract.Tesseract 得到的列大多是正确的,但每隔几行就会读入相邻的列.我想知道是否有一种方法可以设置它的参数,以便六列看起来非常僵硬. 根据其他问题的建议,我尝试使用 --psm 和 hocr 没有取得巨大成功. 使用 jpg 我已在 github 上发布, ..
发布时间:2021-09-06 18:35:01 其他开发

如何避免来自 Google Vision API 的 Http 错误代码 429?

我一直在使用 Google Vision API 在一些使用 Python 的文档中执行 OCR 任务. 它开始完美运行,直到我开始收到 Http 错误代码 429,这意味着我在短时间内执行了太多请求.然后,我决定在每个请求之间进行一次睡眠,其中时间随着 Http Error Code 429 数量的增加而增加.但是,一段时间后,错误消息不断出现.由于消息不断到达,睡眠时间不断增加,直到达到 ..
发布时间:2021-06-12 18:37:33 其他开发

使用 AWS Textract 处理 PDF

我想使用 Textract OCR 服务从 pdf 文件中读取文本.我有一个问题,因为我想在没有 S3 存储桶的情况下在本地进行.我针对图像文件对其进行了测试,效果很好,但不适用于 PDF 文件. 这是我收到错误的代码: response = textract.start_document_text_detection(DocumentLocation=“sample2.pdf") 错误 ..
发布时间:2021-06-12 18:37:26 其他开发

pytesseract image_to_string 函数根本不准确

我的代码 for index, img in enumerate(data): # data 是base64解码的字符串列表b64 = base64.b64decode(bytes(img[22:], encoding='utf-8'))原始 = BytesIO(b64)im = Image.open(raw).convert('LA')像素 = im.load()宽度,高度 = im.size ..
发布时间:2021-06-12 18:37:22 其他开发

如何在 Google Cloud Vision API 中对属于较大句子的块进行分组?

我在 Python 上使用 Google Cloud Vision API 来检测通常位于商店/商店上方的囤积板中的文本值.到目前为止,我已经能够检测单个单词及其边界多边形的坐标.有没有办法根据检测到的词的相对位置和大小对其进行分组? 比如店铺的名字一般都是一样大小写,字是对齐的.API 是否提供了一些函数来对可能是更大句子(商店名称或地址等)的一部分的词进行分组? 如果 API 不提 ..
发布时间:2021-06-12 18:37:19 其他开发