speech-recognition相关内容

Google Speech API

我现在正在处理我的项目,我即将为台式计算机构建一个类似Siri的应用程序。我在想,谷歌语音API对于语音识别来说是否可靠和准确?你能给我推荐一下哪种语音API在语音识别方面最准确吗?最好是一个免费的API。谢谢。 推荐答案 虽然Google Speech API是免费的,但它不是官方的公共API。一些人对它进行了反向工程,discussed in this blog也是如此。如果您计划 ..
发布时间:2022-04-01 23:34:34 其他开发

GS协议是什么意思?

我正在玩Google Speech Recognition API 成功Getting started之后,我尝试了解并在第一个示例中进行了一些更改,但我不知道什么是“GS”协议,也不知道如何将其设置为使用我自己的音频文件。 sync-request.json { "config": { "encoding":"FLAC", "sample_rate" ..
发布时间:2022-03-17 10:17:51 其他开发

Linux 上 Mono 中的 System.Speech

我正在使用 Mono 和 Monodevelop 在 Linux (KUbuntu) 中开展一个项目.我想使用 System.Speech 库,这完全可以在 Windows 7 上的 Unity 中使用 Monodevelop.在过去的几个小时里,我一直在网上进行大量查找,据我所知,System.Speech WAS 添加到单声道. 我已经更新了所有单声道,mono --version 显示 ..
发布时间:2022-01-23 14:39:45 C#/.NET

调用语音识别应用程序的小部件

我正在尝试创建一个包含单个 ImageView 的小部件,单击该小部件会启动语音识别应用程序.我从来没有使用过小部件和待处理的意图,所以我很困惑:如何创建待处理的意图来启动语音识别活动? 我尝试过这样的事情,但它当然失败了: 意图意图 = new Intent();意图 voiceIntent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_S ..
发布时间:2022-01-18 22:25:52 移动开发

Discord 接收音频

我想从 Discord 接收音频以进行语音识别.我还没有在 python Discord APi 中找到任何东西.语音识别没问题,但我不知道如何从 Discord 接收音频.也许有人可以帮助我. 解决方案 这个功能并不存在.有一个 VoiceClient.poll_voice_ws 协程,但是 只是直接从插座.您必须想出某种方法将其解码为音频并自行进一步处理. ..

禁用内置语音识别命令?

我正在尝试构建能够以自定义方式解释各种文本命令的软件.我使用 System.Speech.Recognition,它的效果出奇地好,但我不知道如何解决这样一个事实,即每当我说“删除"、“关闭"、“更正"等时,我都会以默认值结束Windows (7) 实施.有没有办法通过 System.Speech.Recognition 解决这个问题?如果没有,您最推荐哪个 C# .NET 库? 解决方案 ..
发布时间:2022-01-11 23:34:56 C#/.NET

Android语音识别和录音同时进行

我的应用程序使用 AsyncTask 中的 MediaRecorder 类记录音频,并使用 Google API 将语音转换为文本 - 识别器意图 - 使用此问题中的代码:如何在安卓手机中没有烦人的对话框的情况下使用语音识别 我也尝试过在 Thread 中录制音频,但这是更糟糕的解决方案.它会导致更多的问题.我的问题是我的应用程序在模拟器上正常工作.但由于缺乏语音识别服务,模拟器不支持语音识 ..
发布时间:2022-01-07 22:04:23 移动开发

Python 中的 Raspberry Pi 异步/连续语音识别

我想用 Python 为 Raspberry Pi 创建一个语音识别脚本,并且需要一个异步/连续语音识别库.异步意味着我需要无休止地运行识别,直到口语匹配到没有任何键盘输入的单词数组,然后将口语显示到终端并重新开始识别.我已经看过 PocketSphinx,但是经过几个小时的谷歌搜索,我没有找到任何关于异步识别的信息. 你知道有哪家图书馆能做到这一点吗? 解决方案 您可以在 Rasp ..
发布时间:2022-01-05 10:57:54 Python

谷歌语音识别 API

我正在尝试使用 Google Speech API v2(地址 https://www.google.com/speech-api/v2/recognize?...) 我需要使用我的 Api 密钥,但是当我使用它时,我收到 error 403 Forbidden 当我使用我下载的示例项目中的 API 密钥时,它工作正常. 我在 Google Developers Console ..
发布时间:2022-01-01 20:27:18 其他开发

谷歌的语音识别技术有API吗?

我想尝试使用简单的语音命令(如“下一个"或“上一个")创建 jQuery 幻灯片.有没有办法使用谷歌的语音识别?我知道 Chrome 的 x-webkit-speech,但我必须点击一个按钮才能使用它. 我尝试过 MIT 的 WAMI,但我发现它比 Google 的语音认知更慢且准确率更低. 解决方案 截至今天,Chrome 已经存在:http://chrome.blogspot.c ..

AVAudioEngine inputNode installTap 重启录音时崩溃

我正在我的应用中实现语音识别.当我第一次向视图控制器展示语音识别逻辑时,一切正常.但是,当我再次尝试呈现视图控制器时,出现以下崩溃: 错误:[0x190bf000] >avae>AVAudioNode.mm:568: CreateRecordingTap: required 条件为 false: IsFormatSampleRateAndChannelCountValid(format)*** ..

如何训练和制作神经网络的序列化特征向量?

通过序列化,我的意思是输入的值以离散的时间间隔出现,并且向量的大小也事先未知.通常,神经网络采用固定大小并行输入神经元和固定大小并行输出神经元. 可在语音识别中使用序列化实现,其中我可以向网络提供波形的时间序列,并在输出端获取音素. 如果有人能指出一些现有的实现,那就太好了. 解决方案 简单的神经网络作为一种结构在时间尺度变形上没有不变性,这就是为什么将其应用于识别时间序列是不 ..
发布时间:2021-12-31 16:32:34 其他开发

Android 语音语音识别:在 JB 4.1.2 上重复调用 SpeechRecognizer.startListening() 失败

我有一项服务,我在其中反复启动语音识别侦听器,以便我可以进行开放式会话供用户发言.该类还处理 Jelly Bean 中的问题,如果在 5 秒内没有听到任何语音,则会抛出 ERROR_SPEECH_TIMEOUT.所以基本上这是有效的.但是,如果我反复调用 identifyr.startListening(recognizerIntent) ,它会默默地失败,因为在这种情况下从未调用过 onBegi ..
发布时间:2021-12-27 21:11:54 移动开发