google-speech-api相关内容
我正在使用此api的Google:- https://www.google.com/speech-api/v2/recognize?output = json& lang = "+language_code +“& key ="我的密钥" 用于语音识别,并且效果很好. 问题在于数字,即,如果我说一二三四,结果将是 1234 如果我说 1,234> ,结果仍然是 1234 .
..
我尝试将POST请求发送到 https://speech.googleapis.com/v1/speech:recognize 使用下面的JSON和代码片段.谷歌以某种方式响应,未能在我的请求中解码Base 64. {“配置":{"encoding":"LINEAR16","sampleRateHertz":16000,"languageCode":"ja-JP","maxAlternati
..
我正在使用来自云平台的Google Speech API来获取流音频的语音到文本.我已经使用GCP对short audio file的curl POST请求进行了REST API调用. 我看过Google Streaming的文档识别,显示“流语音识别只能通过gRPC进行." 我在 OpenSuse Leap 15.0 中安装了gRPC(也有protobuf).这是该目录的屏幕截图.
..
几个月来,我一直在使用Google Speech API从我的PHP应用程序(使用Google Cloud PHP客户端)将音频转录为文本,这没有任何问题.但是我的呼叫现在开始返回403错误,状态为"PERMISSION_DENIED",并显示消息“呼叫者没有权限". 我正在将Speech API与Google Storage一起使用.我正在使用服务帐户进行身份验证,并将音频数据发送到存储.
..
当我尝试使用curl从cmd命令行(Windows 10)或从本地Firebase服务器使用Google Speech时,出现此错误. “之前或之前,firefire-cli项目尚未使用Cloud Speech API 它被禁用.通过访问启用它 https://console.developers. google.com/apis/api/speech.googleapis.com/over
..
我正在执行语音识别任务,该任务涉及检测儿童的语音能力,随着时间的推移而改善 ... 我想将Google Cloud Speech to Text API用于检测的ASR部分.然后,我将使用不同测量结果的成绩单来估算进度. 但是! Google Speech API的句子级别自动更正功能始终会重写口语的前一段... 是否可以禁用此ASR的自动更正? 我无法使用"speechC
..
我开始使用Google语音API转录音频. 正在转录的音频包含许多个接一个的语音. 例如273298 但是转录又回到了270-3298 我的猜测是它将其解释为某种电话号码. 我想要的是未解析的输出,例如“我可以自己处理和解析的“二七三二二九十八". 对这种事情有设置或支持吗? 谢谢 解决方案 所以我遇到了同样的问题,我想我们找到了解决方案.如果您使
..
我将Windows 10上的Visual Studio 2019用于使用Google Speech API的.NET Console C#项目. 我有以下代码: class Program { static void Main(string[] args) { var URI = "https://speech.googleapis.com/v1/spe
..
我需要将缓冲音频文件.m4a转换为缓冲音频文件.wav,以通过NodeJS发送给Google语音api var toWav = require('audiobuffer-to-wav') var xhr = require('xhr') var context = new AudioContext() //请求MP3作为二进制 xhr({ uri:'audio / track
..
我正在使用麦克风,该麦克风通过浏览器记录声音,将其转换为文件,然后将文件发送到Java服务器.然后,我的Java服务器将文件发送到云语音API,并给我转录.问题在于转录超长(对话2秒的时间约为3.7秒). 所以我想加快转录速度.要做的第一件事是流式传输数据(如果我在记录的开头开始转录.问题是我不太了解api.例如,如果我想从源中转录音频流(浏览器/麦克风),我需要使用某种JS api,但找不
..
我希望能够从电话音频流中提取一个人的话语.电话音频被路由到我的服务器,然后我的服务器创建一个流识别请求.如何判断一个单词是完整发音中的一部分还是当前正在转录中的一部分?我应该比较单词之间的时间戳吗?即使流电话音频中在一定时间内没有语音,API仍会继续返回临时结果吗?如何超过1分钟的流音频限制? 解决方案 关于前三个问题: 您不需要比较单词之间的时间戳,可以通过查看is_final f
..
我已使用下面的这段代码通过Google Speech成功地将包含语音的.wav文件解析为文本. 但是我想访问一个不同的.wav文件,该文件已放置在Google Cloud Storage(公开)上,而不是本地硬盘上.为什么不简单地更改 speech_file = 'my/local/system/sample.wav' 到 speech_file = 'https://cons
..
可以通过向http://www.google.com/speech-api/v2/recognize?... 请求,使用Google的语音识别API来获取音频文件(WAV,MP3等)的转录. 示例:我在WAV文件中说过"二三为五". Google API为我提供了这一点: { u'alternative': [ {u'transcript': u'12345'},
..
我已经搜索了Google的所有可用文档,但是找不到在Python的音频流上进行流语音识别的示例. 当前,我正在Django中使用Python的语音识别来从用户那里获取音频,然后收听音频.然后,我可以保存文件并运行谷歌语音识别,或者直接从创建的音频实例中运行. 有人可以指导我如何对音频流执行流式语音识别吗? 解决方案 Google提供了流式Python API的示例与其打开音频文
..
我已遵循通过使用 来请求api的谷歌云语音api快速入门 curl -s -H "Content-Type: application/json" \ -H "Authorization: Bearer "$(gcloud auth application-default print-access-token) \ https://speech.googleapis.com/
..
我正在使用自定义命令创建语音识别服务,例如"Ok Google".为此,我使用了VoiceInteractionService,并且引用了public class VoiceCommandService extends VoiceInteractionService { private static final String TAG = "AlwaysOnHotwordDetector"; Loc
..
package blessupboys.speechtest; import android.app.Activity; import android.content.Context; import android.content.Intent; import android.net.ConnectivityManager; import android.os.Bundle; import and
..
我能够根据annyang语音api中提供的命令执行操作. 但是我的问题是如何使用此api捕获除命令以外的语音. 我需要与Google语音 https:相同的行为://www.google.com/intl/zh-CN/chrome/demos/speech.html 解决方案 我们可以通过使用annyang.getSpeechRecognizer()获取识别对象来捕获语音而不是命令.
..
这是我第一次发布,因此我对规则不太熟悉,但是可以。 我一直在尝试使Google Cloud Speech API在Android上运行,但无济于事。相同的代码在Java上可以正常工作,但在Android上却不能。 我的代码可以正常运行,直到使用语音客户端调用Recognition方法为止。 这是错误: 11-02 18:38:03.922 6959-6982 / capstone.s
..
我正在将python与Google Cloud Speech API结合使用,我完成了 https://github.com/GoogleCloudPlatform/python-docs-samples/blob/master /speech/api/speech_rest.py " 我收到下一个错误:
..