ocr相关内容

在 CentOS 6 上安装 Tesseract-OCR

我正在尝试在我的服务器上安装 Tesseract-OCR,但是当我安装所有我认为正确的存储库时.当我尝试安装它时,找不到包 我尝试添加 rpmforge 但无济于事.以前做过或熟悉通过 repos 添加和搜索的人有什么想法吗? 解决方案 我使用了这些在 Centos 中正常工作的指令 从 Centos 中的源安装 Tesseract OCR 库 下载 Leptonica ..
发布时间:2022-01-13 21:03:09 其他开发

Base 64 图像到 ocr.space API Ionic 2

我正在尝试将 base 64 Jpeg 发送到 API 以进行 OCR 分析. API 文档可以在这里找到 https://ocr.space/ocrapi 保存图片的代码在这里: takePicture() {相机.getPicture({目的地类型:Camera.DestinationType.DATA_URL,目标宽度:1000,目标高度:1000,编码类型:Camera.En ..
发布时间:2022-01-13 20:20:21 其他开发

如何在 Android 中使用 Tesseract?

我在网上搜索了几个小时.我得到了很多答案,说我们需要为 WINDOWS 的“Tesseract"使用 NDK 等. 但是我没有得到任何关于安装 NDK 时应该做什么的分步/正确解释.如何获取 .so 文件?我已经完成了 NDK 和 Cygwin 的安装.为了检查它是否正确完成,我输入了 make -v 并给出了预期的输出. 任何使用过“Tesseract"的人都可以告诉我他们是如何做到 ..
发布时间:2022-01-10 23:30:58 移动开发

Google Drive SDK - 上传图片、OCR、下载结果

所以最终我会尝试上传我希望 Google 进行 OCR 的图像.然后我希望能够将 OCR 的结果返回到我的 Android 应用程序.我的图片已正确上传.我可以遍历我的谷歌驱动器中的所有文件,我看到有可用的导出链接,其中之一是“文本/纯文本".如果我在浏览器中使用这些 url 之一,它会下载文本.这是我应该尝试访问它的方式吗? 我尝试使用通过对 insert 方法返回的文件调用 getExp ..
发布时间:2022-01-10 19:17:51 移动开发

在 OCR 处理之前移除背景颜色或纹理

典型的手机用户在为卡片大小的物体拍照时,图像中通常会包含一些背景纹理——请参考附件示例.在某些情况下,该背景可能会影响 OCR 的准确性. 我想知道是否有解决方案来去除背景(我肯定有),或者检测背景区域,以便可以在 OCR 之前将它们裁剪掉.在附加图像的情况下,木桌和台面展示是被删除的候选对象.我想对比色可能是一种解决方案,但不太确定. 解决方案 在某些情况下,作为人类,您在区分背景 ..
发布时间:2022-01-09 18:46:23 其他开发

如何从录制的监控摄像头视频中读取时间?

我有一个问题,我必须从监控摄像头录制的视频中读取录制时间. 时间显示在视频的左上角.下面是显示时间的区域的屏幕抓取链接.此外,数字颜色(白色/黑色)在视频播放期间不断变化. http://i55.tinypic.com/2j5gca8.png 请指导我解决这个问题的方向.我是一名 Java 程序员,所以更喜欢通过 Java 的方法. 编辑:感谢 unhillbilly 的评 ..

如何在 Tesseract 和 OpenCV 之间进行选择?

我最近遇到了 Tesseract 和 OpenCV.看起来 Tesseract 是一个成熟的 OCR 引擎,OpenCV 可以用作创建 OCR 应用程序/服务的框架. 我尝试在我的一些图像上使用 Tesseract,它的准确性似乎不错.后来偶然发现了一个非常简单的教程关于使用OpenCV来执行使用 Python 进行 OCR 并印象深刻.几分钟后,我完成了系统的训练,它的准确性很好.但是,当 ..
发布时间:2022-01-09 18:27:44 Python

如何在以编程方式保留文本的同时删除图像中的所有线条和边框?

我正在尝试使用 Tesseract OCR 从图像中提取文本.目前,对于这个原始输入图像,输出的质量很差(大约 50%).但是当我尝试使用 Photoshop 删除所有线条和边框时,输出提高了很多(~90%).有没有办法使用 OpenCV、Imagemagick 或其他技术以编程方式删除图像中的所有线条和边框(保留文本)? 原图: 预期图像: 解决方案 由于没有人发布完整的Op ..
发布时间:2022-01-09 18:13:57 其他开发

从图像中删除边框,但将文本保留在边框上(OCR 之前的预处理)

拥有如上图所示的图像,我可以将其裁剪成四个方形框,使用 OpenCV 形态学操作(基本膨胀、腐蚀)去除边框并得到如下结果: 这在大多数情况下效果很好,但如果有人越界写,这可能会被预测为 7 而不是 2. 我无法找到一种解决方案,该解决方案可以在删除边框的同时恢复写在线条上的字符部分.我拥有的图像已经转换为灰度,因此我无法根据颜色区分书写数字.解决这个问题的最佳方法是什么? 解决方 ..
发布时间:2022-01-09 18:11:39 Python

从表格图像中提取单个字段以使用 OCR 进行 Excel

我已经扫描了具有如下图所示表格的图像: 我正在尝试分别提取每个框并执行 OCR,但是当我尝试检测水平线和垂直线然后检测框时,它会返回以下图像: 当我尝试执行其他转换来检测文本(腐蚀和扩张)时,仍然会出现一些剩余的线条,如下所示: 我无法检测到仅用于执行 OCR 的文本,并且未生成正确的边界框,如下所示: 我无法使用实线得到清晰分隔的框,我已经在一个用paint(如下所示)编 ..
发布时间:2022-01-09 18:10:58 Python

车牌检测有哪些好的算法?

背景 对于我在大学的最后一个项目,我正在开发一个车牌检测应用程序.我认为自己是一名中级程序员,但是我的数学知识缺乏中学以上的任何知识,这使得生成正确的公式比应该做的更难. 我花了很多时间查找学术论文,例如: 检测图像中的车辆牌照 使用图像显着性的鲁棒车牌检测 用于车牌检测的汽车图像局部增强 说到数学,我迷路了.由于这个测试,各种图形图像被证明是有效的,例如: 到 ..
发布时间:2022-01-09 17:59:27 C#/.NET

笔画宽度变换 (SWT) 实现 (Python)

谁能描述我如何在 python 中使用 opencv 或 simplecv 实现 SWT? 解决方案 好的,就这样吧: 底部有代码下载链接的实现细节链接:SWT 为了完整起见,还提到 SWT 或 Stroke Width Transform 是 Epshtein 和其他人在 2010 年设计的,并且已证明是迄今为止最成功的文本检测方法之一.它不使用机器学习或复杂的测试.基本上在 ..
发布时间:2022-01-09 17:57:54 Python

如何从图像中识别车辆牌照/车牌 (ANPR)?

我有一个允许用户上传汽车图像的网站,我想设置一个隐私过滤器来检测车辆上的牌照并对其进行模糊处理. 模糊不是问题,但是否有库或组件(首选开源)可以帮助在照片中找到许可证? 注意事项; 我知道没有什么是完美的,这种类型的图像识别会提供误报和误报. 我很感激我们可以要求用户选择要模糊的区域,我们也会这样做,但问题是专门针对以编程方式查找该数据;因此,诸如“找人检查每张图片"之类的答案 ..
发布时间:2022-01-09 17:57:19 其他开发

用于 OCR 的 Python OpenCV 偏斜校正

目前,我正在做一个 OCR 项目,我需要从标签上读取文本(参见下面的示例图片).我遇到了图像倾斜问题,我需要帮助修复图像倾斜,以便文本是水平的而不是倾斜的.目前,我正在使用的过程尝试从给定范围(代码包含在下面)中对不同角度进行评分,但这种方法不一致,有时会过度校正图像歪斜或完全无法识别歪斜并纠正它.请注意,在进行歪斜校正之前,我将所有图像旋转 270 度以使文本直立,然后通过下面的代码传递图像.传 ..
发布时间:2022-01-09 17:53:16 Python

如何使用 MATLAB 让黑板文字看起来更清晰?

如果我希望最终图像更清晰,具有数字类型的外观,我应该放置什么样的滤镜序列.我的意思是只有两种不同的颜色,一种用于白板,一种用于粉笔书写. 解决方案 在识别图像中的文本时,您最好使用 笔画宽度变换. 这是我在您的图像上获得的一个小结果(基本变换 + 不带过滤的连接组件): 我的 mex 实现基于 here 中的代码 #include "mex.h"#include # ..

从图像python中识别明文

我使用 pytesseract 从图像中识别文本 pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files\Tesseract-OCR\tesseract.exe' 然后我用下面的代码来识别文本 textImg = pytesseract.image_to_string(Image.open(imgLoc+"/"+imgName)) ..
发布时间:2022-01-02 17:38:23 Python

JavaScript 中的现有 OCR 脚本

我有一个 CMS 增强的想法,从图像(例如,扫描的文档)中提取文本信息,想知道是否已经有任何东西可以帮助我? 基本上,我想知道是否有用 JavaScript 编写的现有 OCR 脚本可以从图像中提取句子/单词(例如使用 canvas). 我知道有一些脚本可以执行相对较小的任务,例如验证码破解,但我还没有遇到用于提取完整句子的脚本. 有这种东西吗,还是我需要从头开始写? 解决 ..
发布时间:2021-12-31 17:00:02 前端开发

如何使用 PHP 在网站上实现 OCR?

是否有任何免费的 OCR 库可以在 Linux 服务器上与 PHP 或 Python 一起使用?这个想法是能够上传图像并从中提取字符,或者允许用户“绘制字符",并从所述图像中解析它们. 解决方案 由于您使用的是 Linux 机器,我强烈推荐 Google 的开源项目 ocropus. 它不是 PHP,但我认为它将是您的最佳选择.当然,您可以在 PHP 中通过 exec 调用它.它成熟 ..
发布时间:2021-12-30 10:55:18 PHP

基于多个 OCR 软件包的输出改进 OCR 结果的软件

是否有现有的商业或学术软件可以 覆盖来自多个 OCR 包(Abbyy FineReader、Adobe Acrobat Professional、ReadIris 等)的结果 根据从多个来源积累的知识提供全自动改进 允许在运行时使用额外的外部工具设置(字典、批量网络/本地语料库查找等) ? 注意:我已经有内部解决方案来可视化单一来源的结果,所以如果没有这样的软件可用,我不介意 ..
发布时间:2021-12-29 13:27:32 其他开发