ocr相关内容
我正在使用PyTesser和Tesseract学习OCR.作为第一个里程碑,我想编写一个仅由一些数字组成的识别验证码的工具.我阅读了一些教程,并编写了这样的测试程序. from pytesser.pytesser import * from PIL import Image, ImageFilter, ImageEnhance im = Image.open("test.tiff") im
..
嗨,我正在尝试python库pytesseract从图像中提取文本. 请找到代码: from PIL import Image from pytesseract import image_to_string print image_to_string(Image.open(r'D:\new_folder\img.png')) 但是出现以下错误: Traceback (most re
..
我想使用Tesseract从文档中提取大约10-20个关键字.该文档将包含所有英文字符/单词.我感兴趣的是“年龄:23"之类的东西.在这里,年龄是我感兴趣的关键字,并且也要提取23(该值). 我想到的第一种方法是将整个页面提取到文本中,然后在可识别的文本中查找关键字.但是,在训练整形方面,如果我知道这些关键字,是否有更好的方法,这可能会导致更好的准确性? 我或多或少意识到Tesse
..
我已经根据GitHUb上提供的文档通过MacPorts安装了Tesseract OCR,并且安装成功,并且 但是,我正在尝试将Tesseract OCR用于PHP( https://github. com/thiagoalessio/tesseract-ocr-for-php ),因此我下载了zip文件并将该库包含到我的php文件中,并使用了 echo (new TesseractOC
..
我正在尝试解决Tess4J的安装问题, 1我已经在WEB-INF \ win32-x86 中创建了一个文件夹 2,然后将libtesseract302.dll和liblept168.dll放在此处,并将其添加到Java构建路径中的source/native库中 当我运行时,我发现了错误 java.lang.UnsatisfiedLinkError: Unable to load libr
..
是否可以强制 Zxing库仅扫描文本?我正在寻找脱机(非云)解决方案来扫描Windows Phone中的文本. OR 集成的Bing视觉成功扫描了图像中的文本.有没有一种方法可以在我们的应用程序中调用相同的任务(例如Microsoft.Phone.Tasks)? 解决方案 据我所知,没有本机.NET OCR引擎.从理论上讲,您可以使用任何适用于Win CE的OCR SDK(只要
..
我目前正在使用OCR开发一个Android应用,并且已经达到了调用BaseAPI.init()方法的地步.我不断收到错误消息,指出该目录必须包含tessdata作为子文件夹.我检查了文件目录是否包含其中包含trainingdata文件的文件夹,并确保我指向了正确的目录.我真的很想解决这个问题. 我指向的目录是/mnt/sdcard/Image2Text/.我已确保tessdata是其中包含必
..
我是一名大学生,是时候再次购买教科书.这个季度,我上课需要超过20本书.通常,这没什么大不了的,因为我只是将ISBN复制并粘贴到Amazon中.但是,ISBN会在我学校的书本网站上转换为图像.我要做的就是将ISBN放入一个字符串中,这样就不必手动键入每个ISBN了.我已经使用GOCR将图像转换为文本,但是我想将其与Ruby脚本一起使用,以便我可以自动执行该过程并对同学进行相同的操作. 我可以
..
我想使用tess-two(在android和eclipse中)捕获用相机显示的文本和数字而不用拍照. 我不想保存图像文件. 类似的东西(它正在相机上实时捕获): 我使用过tess-two,但是我必须先拍照然后捕获文本. (使用链接: https://stackoverflow.com/questions/19533273 /best-ocr-optical-character-reco
..
嗨,我正在寻找可以将tiff图像转换为可搜索pdf(OCR)的开源Java API.我到处都有研究,但到目前为止什么都没发现. 注意 我看了这篇文章,但是此API并未将图像转换为pdf Java OCR实现.但是,我仍然在玩一些代码. 解决方案 您可以使用iText将图像转换为PDF.这里的难点是执行OCR,而不是创建PDF. 我会警告您:任何值得使用的OCR引擎都会使您花费大
..
此链接显示了pdf s可以转换为图像.有没有办法在转换为图像之前缩放pdf?在我的项目中,我将pdf s转换为png s,然后使用Python-tesseract库提取文本.我注意到,如果我缩放pdf s并将零件另存为png s,那么OCR会提供更好的结果.那么有没有办法在转换为png之前先缩放pdf? 解决方案 我认为提高图像的质量(分辨率)比放大pdf更好. 使用pdf2imag
..
我是Google Cloud Vision API的新手.我正在对主要用于账单和收据的图像进行OCR. 对于一些图像,它工作正常,但是当我尝试其他图像时,会出现此错误: Error: { [Error: Request Admission Denied.] code: 400, errors: [ { message: 'Request Admission Denied
..
我正在寻找一种免费方法,可以将大量tif文件(10-20k)创建为PDF文件,理想情况下也可以使用OCR. 它必须可以在Windows的命令行中调用. 解决方案 您可以使用 XnView应用程序.它也有命令行. 另一种选择可能是 IrfanView .
..
[mlkit] 我正在从适用于Android的Google机器学习套件中实现“设备上的文字识别".我遵循了本指南,但是每次尝试检测我得到的文本例外 “等待下载文本识别模型.请稍候." 显然,等待无济于事,10秒钟后进行新检测也无济于事. 我有元标记
..
我有这张图片: 我想使用python将其读取为字符串,我认为这并不难.我遇到过tesseract,然后使用tesseract封装了python脚本. 所以我开始阅读图像,在我尝试阅读此图像之前,它做得非常好.我是否必须训练它以阅读特定字体?关于该特定字体有什么想法吗?还是有更好的OCR引擎可以与python配合使用来完成这项工作. 编辑:也许我可以在数字周围做一些矢量,然后以更大
..
我已经在Linux环境中安装了tesseract. 当我执行 之类的命令时,它可以工作 # tesseract myPic.jpg /output 但是我的照片上有一些小标签,而tesseract没有看到它们. 是否可以使用一个选项来设置音高或类似的设置? 文字标签示例: 在这张照片中,tesseract无法识别任何价值... 但是有这张照片: 我有以下
..
我正在使用Google的Vision OCR API尝试从图像中提取2种类型的数据:1)从文本框中输入手写文本;下方标有红色圆圈,并在复选框中标有2)勾号或"x";下面用绿色圆圈标记.我将把这些数据输入数据库,所以我需要为这两种类型的数据返回一个字符串 当前,当我将此图像传递到API时,我得到了包含所有数据的字符串: 中学学习学生对计算机的感知LO 13.您的家人有没有在计算机/IT领
..
我在我的项目中使用AspriseOCR从图像中识别文本. aspriseOCR.jar文件已正确配置到我的Eclipse Build Path Libraries,但是出现以下错误.有人可以指导我如何解决这个问题吗? java.lang.UnsatisfiedLinkError: no AspriseOCR in java.library.path at java.lang.ClassLoa
..
我正在尝试编译OCR tesseract库tess-two的android NDK版本,但是我很困惑为什么收到以下警告.我刚刚从github下载了该库,并尝试使用NDK r9b进行编译. C:\ NV_ANDROIDPACK_BACKUP \ android-ndk-r9b \ tess-two> C:\ NV_ANDROIDPACK_BACKUP \ andr id-ndk-r9b \ n
..
我正在尝试从图像中提取手写文本.我将python与opencv函数(例如find_contours)一起使用.当我使用这样的图像时,一切都很好: 效果很好,因为我有简单的背景.但是后来我用这张图片对其进行了测试: 由于背景中笔记本的线条,我无法仅提取文本.尽管文本为红色,但我将所有图像都设为灰度或有时达到阈值,因此所有颜色都变为黑色,就像笔记本上的线条一样.这样,文本的颜色就无关紧要.
..