google-vision相关内容
我正在构建一个应用程序,有一个使用谷歌视觉API的二维码扫描仪。在读取二维码后,我无法停止摄像头。流程为MainActivity -> QrActivity 收到二维码检测后,应用程序应返回主活动。 如果我不调用cameraSource.release(),它工作得很好,但设备会发热很多,并且对电池耗尽有很大影响。然而,如果我释放摄像头信号源,mainActivity将变得没有响应,应用程序
..
我已将一些测试图像上传到 Google Cloud Bucket,但不想将它们公开(这会作弊).当我尝试为 Google Vision API 运行休息调用时,我得到: {“回应":[{“错误": {“代码":7,“消息":“图像注释器::用户缺少权限.:无法打开文件:gs://images-translate-156512/P1011234.JPG"}}]} 启用 Google Vision
..
我正在做一个学校项目,其中一部分应该是关于 Android 计算机视觉库的现状.我怀着极大的热情去研究它,因为计算机视觉似乎是一个令人着迷的主题,但我已经搜索了一个多星期,但没有找到太多.我希望能够提供有关图书馆本身以及它们之间比较的信息. 我将分享我到目前为止的发现. OpenCV 似乎是最先进和最受欢迎的. 提供最多的功能 向后兼容性有问题 很快(至少我听说
..
我从这里查看了最新的 Google Vision API: https://github.com/googlesamples/android-vision 我正在使用 KitKat 的 LG G2 设备上运行它.我所做的唯一更改是对 Gradle 文件中的 minSdkVerion: ...默认配置 {applicationId "com.google.android.gms.sam
..
我在 Windows 上,使用 Python 3.8.6rc1、protobuf version 3.13.0 和 google-cloud-vision version 2.0.0. 我的代码是: from google.protobuf.json_format import MessageToDict从 google.cloud 导入视觉客户端 = vision.ImageAnnot
..
我在我的项目中使用了 Google 的 Vision API BarcodeScanner.我想在扫描代码后中断扫描并将内容存储在另一个活动中.我怎样才能做到这一点 ?有这么多的类和“互连":x 谢谢! 解决方案 因此,就停止扫描而言,我通过在我的 BarcodeDetector 上调用 .release() 使其工作 实例.我跟着这个例子 正如你所看到的,他们为 BarcodeDe
..
我试图使用 Alloy Appcelerator 的 Google Vision API v1 我创建一个请求 HTTPClient 并调用 API https://vision.googleapis.com/v1/images:annotate?key=MY_APP_KEY 但我收到了来自谷歌的回复文本: {错误 = {代码 = 400;详情 = ({"@type" = "typ
..
我试图使用 Alloy Appcelerator 的 Google Vision API v1 我创建一个请求 HTTPClient 并调用 API https://vision.googleapis.com/v1/images:annotate?key=MY_APP_KEY 但我收到了来自谷歌的回复文本: {错误 = {代码 = 400;详情 = ({"@type" = "typ
..
我正在使用 Googles Vision OCR API 尝试从图像中提取 2 种类型的数据 1) 文本框中的手写文本;下面用红色圆圈标记,2) 勾选或复选框中的“x";下面用绿色圆圈标记.我将把这些数据输入到数据库中,所以我需要为这两种类型的数据返回一个字符串 目前,当我将此图像传递到 API 时,我得到一个包含所有数据的字符串: 中学学习学生对计算机的看法 LO 13.您的家庭成员
..
所以我知道 google-vision api 支持多种语言进行文本检测.通过使用下面的代码,我可以从图像中检测英语.但是根据谷歌,我可以使用参数语言提示来检测其他语言.那么我想在下面的代码中到底把这个参数放在哪里? def detect_text(path):"""检测文件中的文本."""从 google.cloud 导入视觉imageContext = 'bn'客户端 = vision.Im
..
我使用 Google 视觉 API 从任何对象(如报纸或墙上的文字)中读取文本.我尝试了来自 Google 开发者网站的相同示例,但我的文本识别器总是在 IsOperational 函数上返回 false.我在 Blackberry keyone 上测试过,也在 Moto x 上测试过,运行正常. Gradle 文件:编译'com.google.android.gms:play-servic
..
我正在使用谷歌视觉API.为了支持GDPR,我需要在欧盟处理OCR.我该如何执行? 谢谢! 解决方案 此功能在Vision API的v1p4beta1版本中可用.使用以下端点,您可以指示您的文件应在欧盟区域中处理: 对于注释方法: https://vision.googleapis.com/v1p4beta1/{parent = projects/
..
我正在使用 vision.enums.Feature.Type.DOCUMENT_TEXT_DETECTION 提取pdf文档中的一些密集文本.这是我的代码: 来自Google.cloud导入愿景的 def extract_text(存储桶,文件名,mimetype):print('正在寻找PDF {}中的文本'.format(文件名))#BATCH_SIZE;每个json输出文件应分组多少页
..
我们当前正在使用google vision API进行ocr项目,其中图像返回文本值...但是到目前为止,我们仅能处理1张图像,是否可以处理10张图像?即时通讯使用python,此代码仅运行一张图片..谢谢 import os,io从google.cloud导入愿景从google.cloud.vision导入类型将熊猫作为pd导入os.environ ['GOOGLE_APPLICATION_
..
我最近开始使用Google的视觉API.我正在尝试批注图像,因此发布了'离线批量批注图像从他们的文档中获取指南. 但是,我不清楚如何从一个API调用中注释多个图像.假设我已经在Google云端存储桶中存储了10张图片.如何立即注释所有这些图像并将它们存储在一个JSON文件中?现在,我编写了一个程序,调用它们的示例函数,并且可以运行,但是简单起见,为什么我不能说:“查看此文件夹并注释其中的所有
..
我正在尝试开发C#Google Vision API函数. 该代码应编译为dll,并且应运行以执行以下步骤. 从图像路径获取图像. 将图像发送到Google视觉api 调用文档文本检测功能 获取返回值(文本字符串值) 完成 当我运行dll时,它一直给我抛出异常异常错误.我假设问题出在Google凭证上,但不确定... 有人可以帮我这个忙吗?我什至不知道var凭据=
..
我在Windows上,使用 Python 3.8.6rc1 , protobuf版本3.13.0 和 google-cloud-vision版本2.0.0 我的代码是: 来自google.protobuf.json_format的 导入MessageToDict从google.cloud导入愿景客户端= vision.ImageAnnotatorClient()响应= client.an
..
我已经使用Google Vision API实现了QR扫描仪(QRScanner类).一旦检测到一个值,它就会使用Intents传递给另一个活动(Info类).问题是,一旦扫描了QR码,Info类就会被多次打开.我想限制QRScanner类仅获取一个QR值,而Info分类只能打开一次. QRScanner类 @Override受保护的void onCreate(Bundle savedI
..
我正在使用谷歌视觉API. 当我在命令行中卷曲时,它会通过以下命令为我提供200 OK状态: curl -v -k -s -H“内容类型:应用程序/json" https://vision.googleapis.com/v1/images:annotate?key=API_KEY --data-binary @ base64.json 但是当我将其与PHP结合使用时,会收到一条返回消
..
所以我有这段代码,该代码使用base_64编码的数据(图像数据),将其转换为图像并在其上运行google vision(OCR).但是base_64编码的数据存在一些问题.即使认为它是正确的,它也会引发以下错误. 无效的base64编码的字符串:数据字符(167737)的数量不能超过4的倍数1 因为该字符串是2000行,所以我无法在此处输入它, b'/9j/4af ..... TE2f
..