ocr相关内容

更改图像DPI以用于tesseract

我正在一个项目中识别名片中的文本并将其映射到适当的字段.我正在使用opencv进行图像处理.我需要将预处理后的图像馈送到Tesseract-OCR引擎以进行文本识别."https://github.com/tesseract-ocr/tesseract/wiki/ImproveQuality#rescaling" rel ="noreferrer">此链接指出图片的DPI至少应为300.我的图片像 ..
发布时间:2021-05-02 20:37:22 其他开发

使用cv2/pytesseract增强数字识别的局部对比度

我想用pytesseract从图像中读取数字.图片如下: 数字是点缀的,为了能够使用pytesseract,我需要在白色背景上的黑色连接数字.为此,我考虑过使用 erode 和 dilate 作为预处理技术.如您所见,图像相似,但在某些方面却大不相同.例如,第一个图像中的点比背景暗,而第二个图像中的点更白.这意味着,在第一个图像中,我可以使用腐蚀来获得黑色的连接线,而在第二个图像中,我可以使 ..
发布时间:2021-04-27 20:43:53 Python

Python:检测文本块并将其从图像中删除(OpenCV)

我目前正在尝试找出如何检测图像上的文本段落以将其删除. 到目前为止,我添加了一个阈值并找到了轮廓.问题在于注释主体不是作为一个零件而是作为各种轮廓被检测到的.如何合并它们?此外,我想在找到轮廓后将其从图像中删除.背景颜色为RGB(17,17,17),是否可以在其上绘画,或者在OpenCv中它如何工作?我很新. img = cv2.imread("Comment.png")灰色= cv2. ..
发布时间:2021-04-24 19:43:29 Python

如何获得与背景线重叠的文本的边框?

例如,在下面的应用程序屏幕截图中,我要使边界框紧紧围绕在 CA-85S (水平蓝线上的文本)和 Almaden Expy (与蓝线重叠的文本).我正在提取OCR的边界框. 我已经在openCV中尝试了几种方法,但这些方法都不适合我. cv2.inRange .这是使用Python的主要思想和实现: 获得颜色阈值蒙版.加载图像,转换为HSV格式,定义上下颜色范围,然后定义颜色阈值以获得蒙 ..
发布时间:2021-04-23 20:25:34 Python

Tesseract总是在图片中缺少文本行

我正在尝试使用OCR从图片中提取数据.我使用C ++中的Tesseract API来实现这一目标. 原始图片是这样的: 现在对我来说重要的数据是: 但是,永远不会识别出标记的蓝线与我尝试执行的操作无关. 使用tesseract分析图片的代码如下: std :: string readFromFile(const std :: string& filename){tess ..
发布时间:2021-04-19 19:40:41 C/C++开发

无法在pyhton中使用base64编码的数据

所以我有这段代码,该代码使用base_64编码的数据(图像数据),将其转换为图像并在其上运行google vision(OCR).但是base_64编码的数据存在一些问题.即使认为它是正确的,它也会引发以下错误. 无效的base64编码的字符串:数据字符(167737)的数量不能超过4的倍数1 因为该字符串是2000行,所以我无法在此处输入它, b'/9j/4af ..... TE2f ..
发布时间:2021-04-14 19:22:24 Python

Microsoft Azure认知服务手写检测边界框参数

我当前正在使用 Microsoft Azure认知服务手写检测API .API为边界框返回一组值: {"boundingBox":[2,52,65岁46,69,89,795],"text":"dog",... 我想理解这8个参数.它们的意义是什么,它们反映了什么?我试图在Microsoft API的文档中找到有关它们的努力.,但没有用.请帮助我理解这些参数的含义或将我链接到可以消除此疑问的 ..
发布时间:2021-04-13 19:10:05 其他开发

在tesseract C ++ API中禁用字典辅助的OCR

我有一个使用tesseract API对技术数据表进行OCR的应用程序.我这样初始化它: tesseract :: TessBaseAPI tess;tess.Init(NULL,"eng",tesseract :: OEM_TESSERACT_ONLY); 但是,即使使用了这样的自定义白名单 tess.SetVariable("tessedit_char_blacklist",“") ..
发布时间:2021-04-08 20:49:10 C/C++开发

如何从不可搜索的pdf中检测可搜索的pdf?

我有一堆pdf文件,有些是可搜索的常规pdf文件,有些是一些无法搜索的文档的扫描版本.我想提取每个pdf的内容.要提取常规pdf的内容,请使用 Apache Tika ,并从我正在使用的不可搜索的内容中提取内容 tesseract-ocr .但是,我需要区分哪个pdf是标准pdf,哪个不是.有什么办法吗? 解决方案 这将为您提供帮助, 公共静态布尔isSearchablePdf(Stri ..
发布时间:2021-04-08 20:33:08 Java开发

tesseract库的理想图像是什么?

我正在使用tesseract在我的项目中进行OCR.我使用的是72 dpi的图像.但是它给我的输出远远超出了准确度.我读过某个地方提供200 dpi以上的输入效果很好.但是tesseract库的标准图像配置是什么,即大小,dpi,文件格式等? 解决方案 由于字符数限制,这是我答案的第二部分. 这是.mm .m /* * Image.cpp * ImageProce ..
发布时间:2021-02-08 20:14:41 移动开发

比较旋转的图像

我正在寻找一种比较几乎相同(95%+相似度)但可以绕中心轴旋转的图像的方法. 我是整个计算机图形/视觉领域的新手,并且不确定是否有现成的工具或系统,或者这是否是可以询问的正确堆栈. 目前,我正在研究使用C#生成位图直方图,然后通过Panda运行它进行分析,并根据直方图的相似性对图像进行理想分组,尽管我听说过类似OpenCv + tesseract的内容可行的选择. 解决方案 您 ..
发布时间:2020-11-27 02:53:24 其他开发

如何一次用多种语言运行tesseract?

我必须分析包含英语和日语文本的图像.当我默认运行tesseract(-l eng)时,某些日语字符丢失了.否则,如果我使用日语(-l jpn)运行tesseract,则会丢失一些英文字符(例如,电子邮件). 如何运行一个可以识别英文和日文字符的进程? 解决方案 从tesseract 3.02开始,可以为-l参数指定多种语言. -l lang使用的语言.如果未指定,则假定为英语. ..
发布时间:2020-11-27 02:24:07 其他开发

使用OCR识别的文本对图像进行模糊处理

我有一个模糊的图像: 这是名片的一部分,是相机拍摄的没有适当聚焦的镜框之一. 清晰的图像看起来像这样 我正在寻找可以为我提供质量更好的图像的方法,以使图像可以被OCR识别,但也应该非常快.图像不会太模糊(我认为是),但对OCR不利.我试过了: 各种HPF, 拉普拉斯语 Canny检测器 形态学操作的组合(打开,关闭). 我也尝试过: 使用维纳滤波器进行反卷积 反卷 ..
发布时间:2020-11-27 02:23:36 C/C++开发

如何提高图像质量?

我正在制作一个读取ID卡的OCR.使用YOLO获得感兴趣的区域后,我将该裁剪的区域交给Tesseract进行阅读.由于这些裁切后的图像非常小且模糊,因此Tesseract无法读取它们.当它可以读取它们时,它给出了错误的预测.我认为,通过改善裁剪图像的图像质量,可以解决这些问题. 其中一张裁剪的图像: 我的问题是,我将如何改善此类图像? 解决方案 @vasilisg的答案.是一个非常好 ..
发布时间:2020-11-26 23:02:58 Python

Google OCR语言提示

它在此处的文档页面上说: https://cloud.google.com/vision /docs/ocr ,您可以指定语言提示以帮助OCR更准确地检测图像中的文本.有人知道我将在代码中指定语言提示的地方吗?我正在使用.net控制台应用程序对其进行编程. using Google.Cloud.Vision.V1; using System; namespace GoogleCloudSa ..
发布时间:2020-11-18 20:23:34 其他开发

如何检测所有用于在特定字段的表单中输入字母的框?

需要从带有每个字符输入框的表格中识别文本. 我尝试为每个输入使用边界框并裁剪该特定输入,即我可以在“名称"字段中获得用于输入的所有框.但是,当我尝试检测盒子组中的单个盒子时,我无法做到这一点,而opencv对于所有盒子仅返回一个轮廓. for循环中引用的文件是包含边界框坐标的文件. ropped_img是属于单个字段输入(例如名称)的图像. 全形图片 每个字段的裁剪图像 它包含 ..
发布时间:2020-11-10 04:51:42 Python

emgucv:C#中的Pan Card不当偏斜检测

我有3张Pan卡图像,用于使用emgucv和c#测试图像倾斜度。 最上面的第一张图像检测到180度正常工作。 在检测到的90度之间处于中间的第二张图像应检测为180度。 在检测到的180度的检测到第三度图像上应将其检测为90度。 我想在这里分享的一个观察结果是,当我从全景显示卡的上下方向裁剪掉不需要的图像部分时i ng画笔,使用下面提到的代码可以给我预期的结果。 现在 ..
发布时间:2020-10-29 04:55:38 C#/.NET