google-speech-api相关内容

在C ++中将Gstreamer与Google语音API(流式转录)一起使用

我正在使用来自云平台的Google Speech API来获取流音频的语音到文本.我已经使用GCP对short audio file的curl POST请求进行了REST API调用. 我看过Google Streaming的文档识别,显示“流语音识别只能通过gRPC进行." 我在 OpenSuse Leap 15.0 中安装了gRPC(也有protobuf).这是该目录的屏幕截图. ..
发布时间:2020-11-21 01:36:46 C/C++开发

Google Speech API返回403 PERMISSION_DENIED

几个月来,我一直在使用Google Speech API从我的PHP应用程序(使用Google Cloud PHP客户端)将音频转录为文本,这没有任何问题.但是我的呼叫现在开始返回403错误,状态为"PERMISSION_DENIED",并显示消息“呼叫者没有权限". 我正在将Speech API与Google Storage一起使用.我正在使用服务帐户进行身份验证,并将音频数据发送到存储. ..
发布时间:2020-11-18 22:30:39 其他开发

如何在Google Cloud Speech-to-Text API中禁用句子级自动更正

我正在执行语音识别任务,该任务涉及检测儿童的语音能力,随着时间的推移而改善 ... 我想将Google Cloud Speech to Text API用于检测的ASR部分.然后,我将使用不同测量结果的成绩单来估算进度. 但是! Google Speech API的句子级别自动更正功能始终会重写口语的前一段... 是否可以禁用此ASR的自动更正? 我无法使用"speechC ..

Google-Speech-api错误地转录语音号码

我开始使用Google语音API转录音频. 正在转录的音频包含许多个接一个的语音. 例如273298 但是转录又回到了270-3298 我的猜测是它将其解释为某种电话号码. 我想要的是未解析的输出,例如“我可以自己处理和解析的“二七三二二九十八". 对这种事情有设置或支持吗? 谢谢 解决方案 所以我遇到了同样的问题,我想我们找到了解决方案.如果您使 ..

将.m4a转换为.wav

我需要将缓冲音频文件.m4a转换为缓冲音频文件.wav,以通过NodeJS发送给Google语音api var toWav = require('audiobuffer-to-wav') var xhr = require('xhr') var context = new AudioContext() //请求MP3作为二进制 xhr({ uri:'audio / track ..
发布时间:2020-09-24 01:37:13 其他开发

如何加快谷歌云语音

我正在使用麦克风,该麦克风通过浏览器记录声音,将其转换为文件,然后将文件发送到Java服务器.然后,我的Java服务器将文件发送到云语音API,并给我转录.问题在于转录超长(对话2秒的时间约为3.7秒). 所以我想加快转录速度.要做的第一件事是流式传输数据(如果我在记录的开头开始转录.问题是我不太了解api.例如,如果我想从源中转录音频流(浏览器/麦克风),我需要使用某种JS api,但找不 ..

Google Speech API流音频超过1分钟

我希望能够从电话音频流中提取一个人的话语.电话音频被路由到我的服务器,然后我的服务器创建一个流识别请求.如何判断一个单词是完整发音中的一部分还是当前正在转录中的一部分?我应该比较单词之间的时间戳吗?即使流电话音频中在一定时间内没有语音,API仍会继续返回临时结果吗?如何超过1分钟的流音频限制? 解决方案 关于前三个问题: 您不需要比较单词之间的时间戳,可以通过查看is_final f ..

音频流Python上的Google流语音识别

我已经搜索了Google的所有可用文档,但是找不到在Python的音频流上进行流语音识别的示例. 当前,我正在Django中使用Python的语音识别来从用户那里获取音频,然后收听音频.然后,我可以保存文件并运行谷歌语音识别,或者直接从创建的音频实例中运行. 有人可以指导我如何对音频流执行流式语音识别吗? 解决方案 Google提供了流式Python API的示例与其打开音频文 ..
发布时间:2020-09-13 21:14:52 Python

如何在annyang语音API中捕获除命令以外的语音

我能够根据annyang语音api中提供的命令执行操作. 但是我的问题是如何使用此api捕获除命令以外的语音. 我需要与Google语音 https:相同的行为://www.google.com/intl/zh-CN/chrome/demos/speech.html 解决方案 我们可以通过使用annyang.getSpeechRecognizer()获取识别对象来捕获语音而不是命令. ..
发布时间:2020-07-29 20:00:15 其他开发

无法调用SpeechClient.recognize(RecognizeRequest请求):抛出异常

这是我第一次发布,因此我对规则不太熟悉,但是可以。 我一直在尝试使Google Cloud Speech API在Android上运行,但无济于事。相同的代码在Java上可以正常工作,但在Android上却不能。 我的代码可以正常运行,直到使用语音客户端调用Recognition方法为止。 这是错误: 11-02 18:38:03.922 6959-6982 / capstone.s ..