text-recognition相关内容

<canvas> 上的 JavaScript 文本识别和 OCR

我找到了一个可以识别手写数学方程式的网络应用程序: http://webdemo.visionobjects.com/equation.html?locale=default 我想知道是否有人知道实现此机制的应用程序或教程或开源项目,因为从这个 webapp 获取它真的很复杂. 注意:我只需要将画布中绘制的方程式翻译到输入文本框中即可. 解决方案 Tesseract OC ..
发布时间:2022-01-17 11:34:19 前端开发

Google Cloud Vision - 数字和数字 OCR

我一直在尝试用 Python 实现一个 OCR 程序,该程序读取特定格式的数字,XXX-XXX.我使用了谷歌的 Cloud Vision API 文本识别,但结果不可靠.在 30 张高对比度 1280 x 1024 bmp 图像中,只有少数产生了正确的输出,或者至少在结果中包含了正确的输出.该程序往往会省略一些数字,以非英语语言输出或偷偷插入一些特殊字符. 目标是至少连续输出正确的数字,如果 ..

如何使用谷歌云视觉以及 unity 使用移动相机识别文本?

我正在测试一个关于如何使用谷歌云视觉从对象和图片中读取文本的项目.使用移动相机(iphone、ipad 最好或安卓手机)我想获得所需的文本.三星 bixby 应用程序就是一个例子.经过一些阅读,我发现了统一的 OpenCV 和谷歌云视觉.统一的 OpenCV 大约是 95 美元.为了测试,我无法使用它.所以我选择了另一个选项. 我下载了这个项目.Github 项目.我创建了一个谷歌云视觉 a ..
发布时间:2021-09-14 19:30:30 C#/.NET

我们可以使用 Yolo 检测和识别图像中的文本吗

目前我正在使用一种名为“Yolov2"的深度学习模型进行对象检测,我想用它来提取文本并将其保存在磁盘中,但我不知道该怎么做,如果有人的话了解更多,请给我建议 我使用 Tensorflow 谢谢 解决方案 如果您使用预训练模型,则需要保存这些输出并将图像输入到字符识别网络中(如果使用神经网络或其他方法). 您正在做的是“场景文本识别".您可以使用卷积神经网络查看阅读文本论文 ..
发布时间:2021-09-05 19:10:05 其他开发

用于 OCR 的场景文本图像超分辨率

我正在研究 OCR 系统.我在识别 ROI 内的文本时面临的一个挑战是 抖动 或 运动效果 镜头或文本由于角度位置而无法聚焦.请考虑以下演示示例 如果您注意到文本(例如标记为红色),在这种情况下,OCR 系统无法正确识别文本.但是,这种情况也可能在没有角度拍摄的情况下出现,其中图像太模糊以至于 OCR 系统无法识别或部分识别文本.有时它们模糊或有时非常低分辨率或像素化.例如 我们尝试过 ..

在Opencv中使用Canny Edge检测识别图像中的文本

我正在尝试从彩色背景图像中提取文本.我正在尝试的一种方法是边缘检测.使用它,我可以将原始图像转换为可以使用的图像.这样可以消除图像中所有的颜色,只留下边缘. 我使用此代码来获取边缘图像 import cv2将numpy导入为np从matplotlib导入pyplot作为pltimg = cv2.imread('messi5.jpg',0)边= cv2.Canny(img,100,200) ..

提高扫描文档的OCR准确性

我正在使用标准的Brother A3多功能打印机扫描许多A3文档,然后使用FineReader Pro对图像进行OCR处理. 但是,我在识别的字符中遇到很多错误,并且遇到了许多非字母数字的奇怪字符. 有人可以给我任何以编程方式提高OCR准确性的提示吗?可以对扫描的图像进行预处理,也可以对识别的文本进行后处理? 编辑:查找示例pdf .其中包括一些样本图片,我得出的结果最差. ..
发布时间:2021-05-15 20:31:24 其他开发

来自scikit-learn包的CountVectorizer的问题

我有一个电影评论数据集.它有两列:'class'和'reviews'.我已经完成了大多数常规的预处理工作,例如:降低字符,删除停用词,删除标点符号.在预处理结束时,每个原始评论看起来像是用空格分隔符分隔的单词. 我想使用CountVectorizer,然后使用TF-IDF来创建我的数据集的特征,以便我可以使用Random Forest进行分类/文本识别.我调查了网站,然后尝试做网站.这是我的 ..

使用词频进行文本挖掘pdf文件/问题

我正在尝试挖掘具有丰富pdf编码和图形的文章的pdf.我注意到,当我挖掘一些pdf文档时,我得到的高频单词是phi,taeoe,toe,sigma,gamma等.它与某些pdf文档一起使用时效果很好,但我与其他人却收到了这些随机的希腊字母.这是字符编码的问题吗? (顺便说一下,所有文件都是英文的).有什么建议? # Here is the link to pdf file for testi ..
发布时间:2020-07-11 00:19:58 其他开发

Google Mobile Vision Text API示例

我当前正在编写代码,该代码应该能够查看文本图片,然后从基于Android设备的图片中提取文本。我在网上进行了一些研究,发现Google提供了自己的API,称为“ Mobile Vision”(一个包含许多项的程序包,例如文本识别,面部识别等)。但是,在他们的演示中,他们仅演示实时文本识别。我想知道是否有人可以使用Mobile Vision API在静止图像上进行文本识别的示例。欢迎任何帮助。谢谢。 ..
发布时间:2020-06-05 19:25:53 移动开发

如何在Python中检测文本文档图像中段落不一致的文本结构

我试图通过先将其转换为图像然后使用OpenCV来识别.pdf文档中的文本段落.但是我在文本行而不是段落上得到边界框.如何设置一些阈值或其他限制来获取段落而不是行? 这是示例输入图像: 这是上面示例的输出: 我试图在中间的段落上得到一个边框.我正在使用此代码. import cv2 import numpy as np large = cv2.imread('sample ..
发布时间:2020-05-20 20:27:01 Python

Google视觉OCR:垂直和水平线文本识别

我们正在使用Google视觉OCR从收据中收集文字​​. 在某些情况下,收据上会用垂直方式写一些文字,例如增值税信息等. 问题是google vision仅有效地读取了主要方向(例如水平)上的文本,并丢弃了以垂直方向(而不是水平方向)写在同一张收据中的所有文本. 是否有一个参数可以设置,以告诉Google视觉同时获取垂直方向的文字? 我已经将一个带有两个方向的文本图像的示例放在网上. ..
发布时间:2020-05-19 19:33:09 其他开发