ocr相关内容

在 Windows 10 上安装 C++ tesseract

我在 Windows 10 上安装 tesseract 以使用 C++ 进行开发时遇到问题. 谁能提供指南以获得: 1. Leptonica(tesseract需要)lib和includes 2. Tesseract 库和包含 3. 将两者都链接到项目(例如 Visual Studio) 所以这个例子来自 https://github.com/tesseract-ocr/tess ..
发布时间:2021-12-23 18:11:42 C/C++开发

ABBYY Mobile OCR Engine for Iphone

我希望为我的下一个 iPhone 应用程序使用/购买 OCR 解决方案. 在本网站上搜索答案并没有真正帮助我. 有人使用过 iPhone 版 ABBYY Mobile OCR Engine 吗? 我感兴趣的是它有多好(认可度)以及它的成本是多少? 谢谢. 解决方案 我找不到任何真正使用过移动 SDK 的人,但我想我知道如何定价. 大约是 15K + 收入的 2 ..
发布时间:2021-12-22 23:41:24 移动开发

如何使用 opencv 将等宽字体插入图像中?

目前,我可以使用 openCV API (putText) 将一些 HERSHEY 字体文本插入到图像中.但似乎 openCV 不支持任何等宽字体. 我想知道如何在图像中插入一些等宽或固定间距的文本. 解决方案 您可以很容易地将 PIL/Pillow 用于该方面.OpenCV 图像是 numpy 数组,因此您可以使用以下命令从 OpenCV 图像制作枕头图像: PilImage = ..
发布时间:2021-12-22 20:11:14 Python

使用 OCR 阅读循环文本

我想阅读对象上的文本.但是 OCR 程序无法识别它.当我给出小部分时,它可以识别.我必须将圆形文本转换为线性文本.我怎样才能做到这一点?谢谢. 解决方案 您可以将图像从笛卡尔坐标系转换为极坐标系,为 OCR 程序准备圆路径文本图像.这个函数 logPolar() 可以提供帮助. 以下是准备圆形路径文本图像的一些步骤: 使用 HoughCircles() 找到圆的中心. 获取平 ..
发布时间:2021-12-22 20:08:45 其他开发

Google Cloud Vision - 数字和数字 OCR

我一直在尝试用 Python 实现一个 OCR 程序,该程序读取特定格式的数字,XXX-XXX.我使用了谷歌的 Cloud Vision API 文本识别,但结果不可靠.在 30 张高对比度 1280 x 1024 bmp 图像中,只有少数产生了正确的输出,或者至少在结果中包含了正确的输出.该程序往往会省略一些数字,以非英语语言输出或偷偷插入一些特殊字符. 目标是至少连续输出正确的数字,如果 ..

如何知道 PDF 是否仅包含图像或已进行 OCR 扫描以进行搜索?

我有一堆来自扫描文档的 PDF 文件.这些文件包含图像和文本的混合.有些被扫描为没有 OCR 的图像,因此每个 PDF 页面都是一个大图像,即使整个页面完全是文本.其他人使用 OCR 扫描并包含图像和可搜索文本,其中存在文本.在许多情况下,甚至可以搜索图像中的单词. 我想使用 Acrobat 8​​ Pro 使用 OCR 进行自动处理以识别所有扫描文档中的文本,但我不想对已通过 OCR 处理 ..
发布时间:2021-12-20 14:10:59 其他开发

如何使用 openCV 或 OCR tesseract 从图像中提取文本?

可能的重复: 安卓 OCR? 我目前正在基于 Android 手机中的图像捕获进行文本识别项目.我想问一下如何从图片中提取文字? 是否有任何用于提取的 openCV 或 OCR tesseract 教程? 解决方案 最快的方法(可能不是理想的)是实现以下步骤: 使用 OpenCV 来检测纸张 或文本区域; 执行任何必要的处理校正图像(如有必要); 将图像以 TIFF ..
发布时间:2021-12-18 11:43:21 Java开发

安卓 OCR 库

有谁知道任何可用的库或示例代码可以用来开发一个应用程序来读取相机捕获的图像中的文本?类似于 Google Goggles 的东西,但仅用于阅读文本. 解决方案 查看 ABBYY 的 Android OCR 库(付费) Tesseract JNI 包装器(免费) 看看这个stackoverflow帖子 ..
发布时间:2021-12-18 11:23:47 移动开发

在ios上从图像中获取文本(图像处理)

我正在考虑制作一个需要从图像中提取文本的应用程序.我没有做过任何类似的事情,我不想自己实现整个东西.是否有任何已知的库或开源代码(支持 ios、objective-C)可以帮助我从图像中提取文本.一个基本的源代码也可以(我会根据我的需要尝试修改它). 如果有人对此有任何想法,请告诉我. 谢谢,维克拉姆 解决方案 用于在 iOS 上执行 OCR 的主要开源库之一是一个由 goog ..
发布时间:2021-12-18 11:16:02 移动开发

描边宽度变换 (SWT) 实现(Java、C#...)

我最近发现了笔画宽度变换,如以下研究论文所述: 使用笔画宽度变换检测自然场景中的文本.Boris Epshtein、Yonathan Wexler 和 Eyal Ofek.IEEE 计算机视觉和模式识别国际会议,2010 年. 该算法旨在从自然场景中检测和提取文本. 但是,我找不到任何实现,从论文中我发现很难确定有关算法的所有细节,因此我可以在实践中实现它.有谁知道这个算法是否在 ..
发布时间:2021-12-18 11:04:03 Java开发

图像处理以提高tesseract OCR准确性

我一直在使用 tesseract 将文档转换为文本.文档的质量参差不齐,我正在寻找有关哪种图像处理可能会改善结果的提示.我注意到高度像素化的文本——例如由传真机生成的文本——对于tesseract来说尤其难以处理——大概所有这些字符的锯齿状边缘都会混淆形状识别算法. 什么样的图像处理技术可以提高准确性?我一直在使用高斯模糊来平滑像素化图像并看到一些小的改进,但我希望有一种更具体的技术可以产生 ..
发布时间:2021-12-18 10:48:36 其他开发

如何在Windows中获取光标下的单词?

我想创建一个应用程序来获取光标下的单词(不仅用于文本字段),但我找不到如何做到这一点.使用 OCR 非常困难.我见过的唯一工作是 Deskperience 组件.他们支持“本地"方式,但我他们花了很多钱.现在我试图弄清楚这种“本地"方式是什么(也许是某种方式的挂钩).任何帮助将不胜感激. 编辑:我找到了一种方法,但它只获取控件的整个文本.知道如何从整个文本中只获取光标下的单词吗? 解决 ..
发布时间:2021-12-17 23:42:25 C#/.NET

OCR 和字符相似度

我目前正在研究某种 OCR(光学字符识别)系统.我已经编写了一个脚本来从文本中提取每个字符并清除(大部分)不规则之处.我也知道字体.例如,我现在拥有的图像是: M(http://i.imgur.com/oRfSOsJ.png(字体)和 http://i.imgur.com/UDEJZyV.png(已扫描) K(http://i.imgur.com/PluXtDz.png(字体)和 ht ..
发布时间:2021-12-17 14:37:28 其他开发

将 Vision VNTextObservation 转换为字符串

我正在浏览 Apple 的 Vision API 文档,我看到有几个类与UIImages中的文本检测相关: 1) class VNDetectTextRectanglesRequest 2) class VNTextObservation 看起来他们可以检测字符,但我看不到对字符执行任何操作的方法.一旦检测到字符,您将如何将它们转换为可以被 NSLinguisticTagger? ..

如何在 Visual Studio 2010 中实现 Tesseract 与项目一起运行

我在 Visual Studio 2010 中有一个 C++ 项目并希望使用 OCR.我遇到了许多 Tesseract 的“教程",但遗憾的是,我得到的只是头疼和浪费时间. 在我的项目中,我将图像存储为 Mat.我的问题的一种解决方案是将此 Mat 保存为图像(例如 image.jpg),然后像这样调用 Tesseract 可执行文件: system("tesseract.exe imag ..
发布时间:2021-12-10 21:11:59 C/C++开发

提高 Python Tesseract OCR 的准确性

我正在使用 pytesseract 和 openCV 在 Python 中的一个简单 django 应用程序中,用于从图像文件中提取孟加拉语文本.我有一个表单,可让您上传图像,并在单击提交按钮时通过 jQuery 中的 ajax 调用将其发送到服务器端,以从图像中提取文本以实现 OCR(光学字符识别)的目的. 模板部分: ..
发布时间:2021-12-10 21:01:46 其他开发

描边宽度变换 (SWT) 实现 (Python)

谁能描述我如何使用 opencv 或 simplecv 在 python 中实现 SWT? 解决方案 好的,这里是: 包含实现细节的链接,底部有代码下载链接:SWT 为了完整起见,还要提到 SWT 或 Stroke Width Transform 是 Epshtein 等人在 2010 年设计的,并且已经证明是迄今为止最成功的文本检测方法之一.它不使用机器学习或精心设计的测试. ..
发布时间:2021-12-10 20:51:49 Python

使用 OpenCV 为 Tesseract OCR 预处理图像

我正在尝试开发一个应用程序,该应用程序使用 Tesseract 从手机摄像头拍摄的文档中识别文本.我正在使用 OpenCV 对图像进行预处理以更好地识别,应用高斯模糊和阈值方法进行二值化,但结果非常糟糕. 这里是我用于测试的图像: 和这里预处理的图像: 我可以使用哪些其他过滤器来使 Tesseract 的图像更具可读性? 解决方案 我在这里描述了一些为 Tesseract ..
发布时间:2021-12-10 20:50:41 其他开发