ocr相关内容

如何从图像识别车辆牌照/号码牌(ANPR)?

我有一个网站,允许用户上传汽车图片,我想把一个隐私过滤器放在车上检测车牌上的车牌,并模糊它们。 模糊不是问题,但是有一个库或组件(开源的首选),这将有助于在照片中找到许可证。 注意事项 我知道没有什么是完美的,这种类型的图像识别将提供假阳性和阴性。 我明白我们可以要求用户选择区域模糊,我们也将这样做,但问题是具体关于以编程方式发现数据;所以像“让一个人检查每个图像”这样的答案是 ..
发布时间:2016-12-26 10:34:05 其他开发

OpenCV-Python中的简单数字识别OCR

我想在OpenCV-Python(cv2)中实现一个“数字识别OCR”。它只是为了学习的目的。我想学习OpenCV中的KNearest和SVM特性。 我有100个样本(即图像)的每个数字。我想和他们一起训练。 有一个样例 letter_recog.py 随OpenCV示例。但我仍然不能弄清楚如何使用它。我不明白什么是样品,响应等。此外,它加载了一个txt文件,我不知道首先。 稍后 ..
发布时间:2016-12-26 10:30:59 Python

OCR由于字体细节而失败

我有一个包含所有字体字符(Arial在我的情况下)的库。例如: 我使用这个库来OCR文字从图像。 问题是到OCR,诸如“j”,“/”,“t”字符可以彼此重叠!因此,OCR现在是不可能的,因为字符不匹配模式图像(最多3个像素不同) / p> 我如何处理这个问题?有没有更好的方法来比较图像? (C#,WinForms app) 我使用此方法进行比较: unsafe pu ..
发布时间:2016-12-21 23:55:20 C#/.NET

“language_model_penalty_non_dict_word”在tesseract 3.01中没有效果

我通过Tesseract 3.01的配置文件设置 language_model_penalty_non_dict_word ,但它的值没有任何效果。我试过多个图像,并为它的多个值,但每个图像的输出总是相同的。另一个用户已注意到同一另一个问题的评论。 编辑:查看源代码之后,变量 language_model_penalty_non_dict_word 函数 float LanguageMode ..
发布时间:2016-12-20 16:38:25 其他开发

使用Java或.NET库从ColdFusion对PDF执行光学字符识别?

我想要一个PDF并从中提取任何文本。然后我想使用ColdFusion的可用的Verity搜索来搜索内容。 有没有任何库已经做得很好?我包括Java或.NET(Java优先)库,因为他们可以从CF调用。 任何见解或经验将非常感谢...感谢! 编辑:索引PDF文件的工作原理是文本嵌入PDF,就我所知的CF。我必须处理的PDF文本扫描为图像。 解决方案 如果您有能力运行自己的软 ..
发布时间:2016-12-15 13:37:12 Java开发

绘制数字化 - 从图形的图像中刮取样本值

这不是真正的“OCR”,因为它不是识别字符,但它是应用于曲线的相同的想法。任何人知道图像处理库或已建立的算法来检索(光栅)图像中的值?例如,在这个图中,我很难用我的眼睛读取确切的值,因为在网格线之间有这样的差距: 我可以使用直边或任何东西,但它仍然会容易出错。如果有软件可以只截取任何旧图形的屏幕截图,并自动将其转换为值表或可以查询的函数,这将是巨大的。 似乎被称为“曲线识别”?也可以用 ..
发布时间:2016-11-20 17:58:23 其他开发

在CentOS 6上安装Tesseract-OCR

我尝试在我的服务器上安装Tesseract-OCR,但是当我安装所有我相信是正确的回报。当我尝试安装它包没有找到 我试图添加rpmforge但没有效果。 解决方案 我建议您尝试从rpm安装这里: http://pkgs.org/download/tesseract 还有几个依赖项: libpng-devel,libjpeg-devel,libtiff-devel,zlib和lept ..
发布时间:2016-11-14 10:55:34 Linux/Unix

开源代码来删除图片中的非文本区域?

我想从捕获的图像中删除任何非文本区域作为OCR引擎的预处理步骤,任何想法,演示,源代码这将是有用的,感谢。 解决方案 我猜这个问题可能被看作是你的另一个问题的可能重复: 如何从图片中检测文字区域 无论如何,我宁愿用另一种方式来思考这个问题,也就是:任何不是文本区域的东西都应该被忽略。 此时,我需要参考我的其他帖子,其中说明了处理这种情况的方法。这个想法是,您只向OCR引擎发送成 ..
发布时间:2016-11-03 01:54:31 C/C++开发

在OpenCV C ++中对OCR进行标准化

我在做一些简单的OCR车牌识别系统。我使用HaarCascades找到车板,接下来我需要标准化这个板,把它放到我的OCR模块。我使用洪水填充找到汽车板的主要轮廓,然后我执行霍夫变换,找到汽车板的上下边界: 这里是代码的一部分,我执行Hough变换^ HoughLinesP(canny_img,lines,1,CV_PI / 180,80,80,30); for(size_t ..
发布时间:2016-10-23 12:41:21 C/C++开发

Tesseract或任何其他OCR库

我正在寻找一个解释/ API文档/如何使用(和训练?)Tesseract在C + +,没有什么有用的在谷歌Tesseract页面,但还没有在网上找到的东西。 任何有用的来源,经验都会受到欢迎,因为我不知道如何开始。 PS: 我对其他 图书馆提出建议。 只有免费图书馆 解决方案 with Tesseract ... a简单google的“training tesser ..
发布时间:2016-10-23 12:16:29 C/C++开发

如何实现Tesseract在Visual Studio 2010中运行项目

我在Visual Studio 2010中有一个C ++项目,并希望使用OCR。我遇到了许多Tesseract的“教程”,但可惜的是,我得到的是头痛和浪费时间。 在我的项目中,我有一个图像存储为 Mat 。我的问题的一个解决方案是保存此Mat作为图像(例如image.jpg),然后调用Tesseract可执行文件像这样: system(“tesseract.exe image.jpg ..
发布时间:2016-10-17 10:26:47 C/C++开发

使用Tesseract的页面布局分析?

Tesseract 3 能够执行页面布局分析。但是,我找不到任何示例代码或文档如何使用库用于此目的。我希望有人在这里可以解释如何对图像执行布局分析,以及如何解析生成的数据。 解决方案 Tesseract可以指定一个页模式参数( -psm )可以有以下值: 0 =方向和脚本检测)。 1 =使用OSD自动分页。 2 =自动分页,但不显示OSD或OCR 3 =分割,但没有OSD。 ( ..
发布时间:2016-10-16 14:34:04 C/C++开发

如何使用OpenCV从名片中删除非文本区域?

我的目标是从扫描的名片图像中删除任何非文本区域,但我不知道执行使用OpenCV的步骤,我已经按照这些步骤,但不知道这是正确的或不是 1)将图像转换为灰度 > 2)二进制图像 3)反转颜色(cv :: bitwise_not)文本 4)蚀刻图像(cv :: erode) p> 6)使用hough transform(尚未)检测文本行 代码: cv : ..
发布时间:2016-10-14 10:29:57 C/C++开发

哪些文件应该包括在训练的tesseract后tessdata文件夹?

我使用tesseract作为我的ANPR应用程序的OCR引擎。我已经训练tesseract 3.01v与numberplate字体。但我需要知道: 哪些文件应该包含在tessdata文件夹中? 我使用tesseract 3.01v安装相同的tessdata文件夹? 我已经训练了tesseract 3.01v,我在我的代码中使用tessnet2,这将是一个问题吗? 以下是我尝试使用的 ..
发布时间:2016-10-10 20:52:53 C#/.NET

在字符串模糊匹配多个单词

我想聘请 Levenshtein距离的帮助找模糊关键字(静态文本)一个OCR页面上。结果 。要做到这一点,我想给被允许误差的百分比(如15%)。 字符串关键字=“逾期电服务”; 由于关键字是25个字符长,我想允许4错误(25 * 0.15圆角高达)结果 我需要能够比较它... 字符串Entire_OCR_Page =“以前在13年12月26日感谢$ b $收到的 ..
发布时间:2016-10-03 21:33:32 C#/.NET

微软Windows 7 API OCR

我一直在审查替代Office 2007的MODI OCR(OneNote中的2010解决方案具有质量较差/效果比2007 :-()我注意到Windows 7包含一个OCR库,一旦你安装的 ..
发布时间:2016-09-26 11:27:46 C#/.NET

最好的.NET API OCR?

有人能列举一些C#OCR的API?或仍是唯一的选择C ++与包装? 解决方案 任何像样的OCR引擎需要数年时间来开发和大多数已在C或C ++开发。大多数工具包,如飞马,Asprise设有接口,C,C ++和C#。许多供应商创建精简的包装是现有的OCR引擎,如ABBYY FineReader中,谷歌的tesseract和ScanSoft公司Caere(OMNIPAGE)拿去卖作为贴牌产品。 ..
发布时间:2016-09-22 21:19:51 C#/.NET