google-cloud-vision相关内容
我已将一些测试图像上传到 Google Cloud Bucket,但不想将它们公开(这会作弊).当我尝试为 Google Vision API 运行休息调用时,我得到: {“回应":[{“错误": {“代码":7,“消息":“图像注释器::用户缺少权限.:无法打开文件:gs://images-translate-156512/P1011234.JPG"}}]} 启用 Google Vision
..
有什么方法可以限制谷歌云视觉,尤其是 TEXT_DETECTION 类型只能识别数字?我认为这将大大改善我的结果. 我在互联网上根本找不到任何结果或提示.任何帮助表示赞赏. 解决方案 目前我们无法单独使用数字进行约束.您是否尝试过使用粒度 polybox 更新的响应流,看看这是否仍然是一个问题?
..
我在 Raspberry PI 上使用 Google Cloud Vision API.当我在我的家(首次访问云帐户的地方)网络上使用它时,它工作正常,但如果我从不同的网络访问 API,它会引发令牌刷新错误.我已经使用 NTP 同步了时间,但没有帮助. 详细错误: oauth2client.client.HttpAccessTokenRefreshError: invalid_gran
..
嗨,我正在尝试使用谷歌的云视觉 API,特别是这个例子:https://cloud.google.com/vision/docs/label-tutorial#label_tutorial_1 我遵循了本教程:https://cloud.google.com/vision/docs/getting-started#set_up_a_service_account 用于设置服务帐户,但是当我运
..
我一直在尝试用 Python 实现一个 OCR 程序,该程序读取特定格式的数字,XXX-XXX.我使用了谷歌的 Cloud Vision API 文本识别,但结果不可靠.在 30 张高对比度 1280 x 1024 bmp 图像中,只有少数产生了正确的输出,或者至少在结果中包含了正确的输出.该程序往往会省略一些数字,以非英语语言输出或偷偷插入一些特殊字符. 目标是至少连续输出正确的数字,如果
..
我正在尝试使用来自 Google Cloud Vision API 的现在支持的 PDF/TIFF 文档文本检测.使用他们的示例代码,我可以提交 PDF 并接收带有提取文本的 JSON 对象.我的问题是保存到 GCS 的 JSON 文件仅包含“符号"的边界框和文本,即每个单词中的每个字符.这使得 JSON 对象非常笨拙且非常难以使用.我希望能够获得“LINES"、“PARAGRAPHS"和“BLO
..
我在将 base64 编码图像发送到 Google Cloud Vision 时遇到问题.有趣的是,如果我通过 URI 发送图像,它工作正常,所以我怀疑我的编码方式有问题. 交易如下: from google.cloud import vision导入 base64客户端 = vision.ImageAnnotatorClient()image_path ='8720911950_9182
..
我正在尝试开发一个需要知道图像中标记对象位置的应用程序.知道图像中有“钢琴"是不够的,我需要知道钢琴在图像中的位置. Microsoft 的计算机视觉 API 和 Google 的 Cloud Vision API 都提供了某种形式的裁剪建议/智能缩略图生成服务,这让我认为正在检测某些对象的位置 - 但是有没有办法获取该信息(例如每个检测到的对象周围的边界框)来自 Microsoft 的计算
..
我正在测试一个关于如何使用谷歌云视觉从对象和图片中读取文本的项目.使用移动相机(iphone、ipad 最好或安卓手机)我想获得所需的文本.三星 bixby 应用程序就是一个例子.经过一些阅读,我发现了统一的 OpenCV 和谷歌云视觉.统一的 OpenCV 大约是 95 美元.为了测试,我无法使用它.所以我选择了另一个选项. 我下载了这个项目.Github 项目.我创建了一个谷歌云视觉 a
..
我一直在使用 Google Vision API 在一些使用 Python 的文档中执行 OCR 任务. 它开始完美运行,直到我开始收到 Http 错误代码 429,这意味着我在短时间内执行了太多请求.然后,我决定在每个请求之间进行一次睡眠,其中时间随着 Http Error Code 429 数量的增加而增加.但是,一段时间后,错误消息不断出现.由于消息不断到达,睡眠时间不断增加,直到达到
..
我在 Python 上使用 Google Cloud Vision API 来检测通常位于商店/商店上方的囤积板中的文本值.到目前为止,我已经能够检测单个单词及其边界多边形的坐标.有没有办法根据检测到的词的相对位置和大小对其进行分组? 比如店铺的名字一般都是一样大小写,字是对齐的.API 是否提供了一些函数来对可能是更大句子(商店名称或地址等)的一部分的词进行分组? 如果 API 不提
..
我想使用来自谷歌云视觉 API 的图像 (OCR) 的文本检测.但我不知道如何从 C# 中获取订阅密钥以及如何在 C# 中进行身份验证和调用.有人可以告诉我一步一步的程序来做到这一点.顺便说一句,我很新. 解决方案 我觉得这个问题有点混乱,所以让我退后一步,尝试涵盖在使用 Cloud Vision API 时与身份验证有关的最重要的事情. 首先,该文档对如何向 Cloud Visio
..
敏捷的棕色狐狸跳过懒惰的狗 在这种情况下,假设也有不同的字体系列,cloud VIsion API 可以检测到这一点.或者任何其他 OCR API 都能干净地检测到这一点.Tesseract 有能力,但它太不准确了. 解决方案 谷歌云视觉 API 是否检测 OCRed 文本中的格式,如粗体、斜体、字体名称(helvetica 或 times new roman)等? 不幸的
..
我正在使用 vision.enums.Feature.Type.DOCUMENT_TEXT_DETECTION 提取pdf文档中的一些密集文本.这是我的代码: 来自Google.cloud导入愿景的 def extract_text(存储桶,文件名,mimetype):print('正在寻找PDF {}中的文本'.format(文件名))#BATCH_SIZE;每个json输出文件应分组多少页
..
我是GCP的新开发人员,并且了解Google Cloud AutoML自定义模型.但是我在使用AutoML Vision时遇到两个问题. 1.我无法将数据从云存储中的csv文件导入数据集.我正在使用C#调用RestAPI,但它的错误404.下面是我的代码. var uri ="https://automl.googleapis.com/v1beta1/projects/{project-
..
我正在尝试将一个狗图像与一桶装满狗图像的桶进行比较,并获得它们的相似性,有人有这样做的线索吗? 解决方案 您可以尝试Vision API的ProductSearch: https://cloud.google.com/vision/product-search/docs/ 您构建产品的ProductSet.您将参考图像添加到每个产品.稍后,您发送一个查询图像,它将在您的Product
..
我正在使用Node.js Firebase Cloud Function,但是需要获取我存储在Firebase Storage中的图像,以便可以发送到Google Cloud vision API. 需要视觉API 从本地图像发送文件: //const fileName ='本地映像文件,例如/path/to/image.png';//对本地文件执行安全的搜索检测const [结果] =等
..
IBM Watson具有一项功能,您可以使用图像在Watson上训练分类器,但是我无法在Google Cloud Vision API上找到类似的功能?我想要的是我上传10-15类图像,然后根据上传图像对之后加载的所有图像进行分类.IBM Bluemix(Watson)具有此功能,但其价格明显高于Google.如果价格低于Google的 ,我也可以使用其他服务 解决方案 据我所知,Googl
..
尝试使用c#asp.net c#使用Google Cloud Vision检测图像值,但出现错误. 加载本机库时出错.在任何可能的位置找不到:C:\ Users \ mazharkhan \ Documents \ Visual Studio 2013 \ WebSites \ googleapi \ bin \ grpc_csharp_ext.x86.dll,C:\ Users \ mazha
..
我目前在android studio中遇到问题.我已经设置了我的Google应用程序凭据环境变量,并一遍又一遍地重启了android studio,这给了我同样的错误. 我知道我为我的应用使用了正确的服务帐户 JSON 文件,并且知道设置了 GOOGLE_APPLICATION_CREDENTIALS 环境变量(该变量显示在我的android studio终端中和计算机的终端),我不知道为什
..