ocr相关内容

使用C#进行OCR读取

我有一个项目,该项目要读取捕获的图像中的字符,但是我被卡在要扫描图像的按钮上.我最终在c#中找到了tesseract dll,但是我不知道该如何编码.我是这个程序设计的新手. private void Browse_Click(object sender, EventArgs e) { //FileInfo fi = new FileInfo(string.Form ..
发布时间:2020-05-19 19:38:03 C#/.NET

合并经过训练的数据文件-Tesseract

我正在tesseract中使用两个训练有素的数据文件,以便识别两种语言.但是由于准确性不够,我训练了tesseract并生成了一个新的训练数据文件,我想将其与我使用的两种语言文件之一合并.所以我的问题是:怎么可能将新的训练数据文件与以下文件之一合并:解决方案 您可以解压缩现有的.traineddata并分别合并各个组件;但是,我不确定这是否行得通.您可以创建ell1.traineddata并在命 ..
发布时间:2020-05-19 19:37:58 其他开发

OCR为什么找不到唯一字符

我使用OCR puma.net并得到结果.但是结果不仅包含(a b c d),而且还包含(; / , "). 我只想输出这些字符.我该怎么用? 这是我的代码: var puma = new PumaPage(img.ToBitmap()); using (puma) { puma.FileFormat ..
发布时间:2020-05-19 19:37:52 C#/.NET

Tesseract OCR“您的计算机中缺少VCRUNTIME140.dll"但是示例解决方案有效吗?

我在Visual Studio 2013解决方案中安装了Tesseract NuGet软件包,并且在运行时初始化Tesseract引擎时,它引发错误“该程序无法启动,因为您的计算机缺少VCRUNTIME140.dll.请尝试将程序重新安装到解决此问题." 奇怪的是,在此处找到的示例解决方案确实可以编译,构建和运行,并且可以找到该dll或不需要它?我已经检查了配置管理器和引用管理器.它们在生成 ..
发布时间:2020-05-19 19:37:50 C#/.NET

OCR Tesseract-Tess4J表现异常

我正在尝试从图像中提取文本.问题是我正在使用下面给出的代码来处理图像并打印提取的文本. public class Test { public static void extractText(String filename) // public static void main(String[] args) { System.setPr ..
发布时间:2020-05-19 19:37:48 Java开发

仅在我的iOS应用程序中将tesseract字符限制为a-z和数字

我正在使用tesseract来识别我的iOS项目之一中的字符.现在正在读取所有字符,包括字母数字字符.但是我只想读取字符a-z和数字0-9.我遵循了“> tesseract正在寻找的限制字符,但无法弄清楚我可以在我的iOS应用中实现此功能. 任何人都可以建议我如何在我的iOS项目中实现这一目标. 解决方案 您可以在提取之前使用TessBaseAPI.SetVariable指定白名单( ..
发布时间:2020-05-19 19:37:43 移动开发

如何将OCR文本从一个PDF传输到另一个PDF?

我有一个相同的扫描PDF的两个版本.其中之一具有OCR层.如何将层转移到另一层?我已经安装了Ghostscript,但是我不知道下一步该怎么做. 如何使用Ghostscript 解决方案 PDF中没有"OCR层"之类的东西. 您最可能拥有的是一个PDF文件,其中包含扫描的图像以及使用OCR从该图像中提取的文本,这些文本被绘制为“不可见"文本(文本呈现模式3). 通常,您无 ..
发布时间:2020-05-19 19:37:32 其他开发

适用于Android应用程序tess4j的OCR

基本上是在设计一个应用程序,该应用程序将从android设备默认相机捕获图像并在图像视图中显示该图像!工作正常!足够好! capt_but.setOnClickListener(new View.OnClickListener() { //@Override // TODO Auto-generated method stub ..
发布时间:2020-05-19 19:37:30 Java开发

使用OpenCV清洁文本图像以进行OCR读取

我收到了一些需要处理的图像,以便对其中的一些信息进行OCR.这是原稿: 原始版本1 原始2 原始3 原始4 在使用以下代码处理它们之后: img = cv2.imread('original_1.jpg', 0) ret,thresh = cv2.threshold(img,55,255,cv2.THRESH_BINARY) opening = cv2.mor ..
发布时间:2020-05-19 19:37:24 Python

如何使用Java忽略Tesseract OCR中的特殊字符

我已经使用Java通过Tesseract OCR从图像中提取了文本.但是输出包含一些特殊字符,因为图像包含一些符号. 我想忽略所有特殊字符,只显示文本.我有什么办法可以做到这一点? 解决方案 在tesseract中,您可以设置TessBaseAPI.VAR_CHAR_WHITELIST和TessBaseAPI.VAR_CHAR_BLACKLIST以便忽略某些特殊字符. 以下操作 ..
发布时间:2020-05-19 19:37:20 Java开发

OCR代码流或我的代码没有意义

当前,我正在创建一个应用程序,该应用程序将使用Android上的camera API捕获和存储图像.在该过程之后,我想扫描图像中的文本并使用TextToSpeech将其输出为音频. 贝娄是我的MainActivity代码,我不知道为什么TextRecognizer无法正常工作.任何帮助或提示将不胜感激. package com.telbound.chard1988.ncstocr; imp ..
发布时间:2020-05-19 19:37:17 移动开发

机器打印文字的ICR吗?

我知道ICR主要用于手写(手工打印)数据识别,但是我们能否利用ICR来提取失真的(质量较差)的机器打印文本呢? 如果不是解决以下问题的最佳方法 我有一个非结构化文档,可能会分成两页或更多页,文档中几乎没有手写的日期字段.现在我想将其转换为文本文件. 我尝试了一些具有ICR模块转换为文本文件的整页ocr(多功能网页和abbyy等)工具. 它们擅长于整页OCR,但是当遇到手写日期时,会在其 ..
发布时间:2020-05-19 19:37:14 其他开发

Tesseract OCR在单点触控中

如何在Iphone的单点触控应用程序中实现Tesseract OCR? 解决方案 首先,您需要将库 port 移植到iOS并作为 static 库使用. Vikas的答案( Pocket-PCR )可能会派上用场(但我还没有尝试过) 接下来,您需要创建到库的C#绑定. 当API导出C函数时,您可以使用 normal .NET pinvokes,即使用如果提供了Objective ..
发布时间:2020-05-19 19:36:59 移动开发

使用Tess4j进行OCRing时禁止在控制台上显示警告

禁止使用警告-"警告.无效的分辨率1 dpi.改为使用70.".当使用Tess4j进行OCRing时 大家好,我想抑制在使用Tess4j进行OCRing时在控制台中抛出的警告.请帮忙. Tesseract在内部使用Leptonica进行某些图像处理,Leptonica在控制台上对此进行了介绍. TIA 解决方案 解决方法:并非来自Leptonica(lept4j),而是来 ..
发布时间:2020-05-19 19:36:53 Java开发