ocr相关内容
我有一个项目,该项目要读取捕获的图像中的字符,但是我被卡在要扫描图像的按钮上.我最终在c#中找到了tesseract dll,但是我不知道该如何编码.我是这个程序设计的新手. private void Browse_Click(object sender, EventArgs e) { //FileInfo fi = new FileInfo(string.Form
..
我正在tesseract中使用两个训练有素的数据文件,以便识别两种语言.但是由于准确性不够,我训练了tesseract并生成了一个新的训练数据文件,我想将其与我使用的两种语言文件之一合并.所以我的问题是:怎么可能将新的训练数据文件与以下文件之一合并:解决方案 您可以解压缩现有的.traineddata并分别合并各个组件;但是,我不确定这是否行得通.您可以创建ell1.traineddata并在命
..
所以我试图弄清楚如何使用TessBase,并且在baseApi.init(dataPath, "eng")处出现错误.我得到的错误是:directory must contain tessdata.我不知道如何获取包含tessdata的目录.这是包含eng.traineddata的目录的图像.这是我的代码: Bundle extras = data.getExtras();
..
我使用OCR puma.net并得到结果.但是结果不仅包含(a b c d),而且还包含(; / , "). 我只想输出这些字符.我该怎么用? 这是我的代码: var puma = new PumaPage(img.ToBitmap()); using (puma) { puma.FileFormat
..
我在Visual Studio 2013解决方案中安装了Tesseract NuGet软件包,并且在运行时初始化Tesseract引擎时,它引发错误“该程序无法启动,因为您的计算机缺少VCRUNTIME140.dll.请尝试将程序重新安装到解决此问题." 奇怪的是,在此处找到的示例解决方案确实可以编译,构建和运行,并且可以找到该dll或不需要它?我已经检查了配置管理器和引用管理器.它们在生成
..
我正在尝试从图像中提取文本.问题是我正在使用下面给出的代码来处理图像并打印提取的文本. public class Test { public static void extractText(String filename) // public static void main(String[] args) { System.setPr
..
我正在尝试在android studio中构建tesseract库. abhimanyu @ MyPC:〜/Documents/tess-two-master/tess-two $/home/abhimanyu/Android/Sdk/tools/android更新项目--path. 错误:项目没有设置目标或目标无效. 请为'android update'命令提供--target.
..
我正在使用tesseract来识别我的iOS项目之一中的字符.现在正在读取所有字符,包括字母数字字符.但是我只想读取字符a-z和数字0-9.我遵循了“> tesseract正在寻找的限制字符,但无法弄清楚我可以在我的iOS应用中实现此功能. 任何人都可以建议我如何在我的iOS项目中实现这一目标. 解决方案 您可以在提取之前使用TessBaseAPI.SetVariable指定白名单(
..
我正在尝试使用谷歌视觉api从图像中提取文本,它可以工作.但是我只想检测图像的一部分以获得某些文本. 这是我使用的图片 我只想提取maybank2u.com到From Account:的所有文本 我知道有一些教程可以通过使用块来实现此技巧,但是这些教程是不同的编程语言. 我的代码:
..
我是usig tess4j(net.sourceforge.tess4j:tess4j:4.4.0),并尝试对pdf文件进行OCR. 因此,据我了解,我必须先将pdf转换为tiff或png(建议使用其中的任何一个?),我是这样做的: tesseract.doOCR(PdfUtilities.convertPdf2Tiff(inputPdfFile)); 并收到以下警告: Warn
..
我有一个相同的扫描PDF的两个版本.其中之一具有OCR层.如何将层转移到另一层?我已经安装了Ghostscript,但是我不知道下一步该怎么做. 如何使用Ghostscript 解决方案 PDF中没有"OCR层"之类的东西. 您最可能拥有的是一个PDF文件,其中包含扫描的图像以及使用OCR从该图像中提取的文本,这些文本被绘制为“不可见"文本(文本呈现模式3). 通常,您无
..
基本上是在设计一个应用程序,该应用程序将从android设备默认相机捕获图像并在图像视图中显示该图像!工作正常!足够好! capt_but.setOnClickListener(new View.OnClickListener() { //@Override // TODO Auto-generated method stub
..
这是我收到的收据图像,我已使用matplotlib对其进行了绘制, # x1, y1, x2, y2, x3, y3, x4, y4 bbox_coords = [[650, 850], [1040, 850], [1040, 930], [650, 930]] image = cv2.imread(IMG_FILE) gray = cv2.cvtColor(image, cv2.COLO
..
我收到了一些需要处理的图像,以便对其中的一些信息进行OCR.这是原稿: 原始版本1 原始2 原始3 原始4 在使用以下代码处理它们之后: img = cv2.imread('original_1.jpg', 0) ret,thresh = cv2.threshold(img,55,255,cv2.THRESH_BINARY) opening = cv2.mor
..
我已经使用Java通过Tesseract OCR从图像中提取了文本.但是输出包含一些特殊字符,因为图像包含一些符号. 我想忽略所有特殊字符,只显示文本.我有什么办法可以做到这一点? 解决方案 在tesseract中,您可以设置TessBaseAPI.VAR_CHAR_WHITELIST和TessBaseAPI.VAR_CHAR_BLACKLIST以便忽略某些特殊字符. 以下操作
..
当前,我正在创建一个应用程序,该应用程序将使用Android上的camera API捕获和存储图像.在该过程之后,我想扫描图像中的文本并使用TextToSpeech将其输出为音频. 贝娄是我的MainActivity代码,我不知道为什么TextRecognizer无法正常工作.任何帮助或提示将不胜感激. package com.telbound.chard1988.ncstocr; imp
..
我知道ICR主要用于手写(手工打印)数据识别,但是我们能否利用ICR来提取失真的(质量较差)的机器打印文本呢? 如果不是解决以下问题的最佳方法 我有一个非结构化文档,可能会分成两页或更多页,文档中几乎没有手写的日期字段.现在我想将其转换为文本文件. 我尝试了一些具有ICR模块转换为文本文件的整页ocr(多功能网页和abbyy等)工具. 它们擅长于整页OCR,但是当遇到手写日期时,会在其
..
如何在Iphone的单点触控应用程序中实现Tesseract OCR? 解决方案 首先,您需要将库 port 移植到iOS并作为 static 库使用. Vikas的答案( Pocket-PCR )可能会派上用场(但我还没有尝试过) 接下来,您需要创建到库的C#绑定. 当API导出C函数时,您可以使用 normal .NET pinvokes,即使用如果提供了Objective
..
禁止使用警告-"警告.无效的分辨率1 dpi.改为使用70.".当使用Tess4j进行OCRing时 大家好,我想抑制在使用Tess4j进行OCRing时在控制台中抛出的警告.请帮忙. Tesseract在内部使用Leptonica进行某些图像处理,Leptonica在控制台上对此进行了介绍. TIA 解决方案 解决方法:并非来自Leptonica(lept4j),而是来
..
我想检测图像中每个字符的位置. 我按照如何在pytesseract中获得角色位置的建议尝试了pytesseract 但给我一个错误 import csv import cv2 from pytesseract import pytesseract as pt pt.run_tesseract('bw.png', 'output', lang=None, boxes=True, con
..