speech-recognition相关内容
我现在正在处理我的项目,我即将为台式计算机构建一个类似Siri的应用程序。我在想,谷歌语音API对于语音识别来说是否可靠和准确?你能给我推荐一下哪种语音API在语音识别方面最准确吗?最好是一个免费的API。谢谢。 推荐答案 虽然Google Speech API是免费的,但它不是官方的公共API。一些人对它进行了反向工程,discussed in this blog也是如此。如果您计划
..
尝试在ubuntu 16.04中使用PIP3安装pydio时出现以下错误: Collecting pyaudio Downloading PyAudio-0.2.11.tar.gz Installing collected packages: pyaudio Running setup.py install for pyaudio ... error Complete out
..
我在安装了pyAudio的Python2.7中运行以下代码。 import speech_recognition as sr r = sr.Recognizer() with sr.Microphone() as source: # use the default microphone as the audio source audio = r.list
..
我正在玩Google Speech Recognition API 成功Getting started之后,我尝试了解并在第一个示例中进行了一些更改,但我不知道什么是“GS”协议,也不知道如何将其设置为使用我自己的音频文件。 sync-request.json { "config": { "encoding":"FLAC", "sample_rate"
..
..
我正在使用 Mono 和 Monodevelop 在 Linux (KUbuntu) 中开展一个项目.我想使用 System.Speech 库,这完全可以在 Windows 7 上的 Unity 中使用 Monodevelop.在过去的几个小时里,我一直在网上进行大量查找,据我所知,System.Speech WAS 添加到单声道. 我已经更新了所有单声道,mono --version 显示
..
我正在尝试创建一个包含单个 ImageView 的小部件,单击该小部件会启动语音识别应用程序.我从来没有使用过小部件和待处理的意图,所以我很困惑:如何创建待处理的意图来启动语音识别活动? 我尝试过这样的事情,但它当然失败了: 意图意图 = new Intent();意图 voiceIntent = new Intent(RecognizerIntent.ACTION_RECOGNIZE_S
..
我的 Speech Recon 项目有两部分与 Nuance,模块的 .h 文件 (ObjectiveC) 和 ViewController (swift). 我想在我的swiftviewController中设置一个SpeechRecognition对象,并监听onBegin、onStop...等方法. 使其编译的唯一方法是使用 nil 作为委托参数来初始化 SpeechRecon
..
我想从 Discord 接收音频以进行语音识别.我还没有在 python Discord APi 中找到任何东西.语音识别没问题,但我不知道如何从 Discord 接收音频.也许有人可以帮助我. 解决方案 这个功能并不存在.有一个 VoiceClient.poll_voice_ws 协程,但是 只是直接从插座.您必须想出某种方法将其解码为音频并自行进一步处理.
..
我正在尝试构建能够以自定义方式解释各种文本命令的软件.我使用 System.Speech.Recognition,它的效果出奇地好,但我不知道如何解决这样一个事实,即每当我说“删除"、“关闭"、“更正"等时,我都会以默认值结束Windows (7) 实施.有没有办法通过 System.Speech.Recognition 解决这个问题?如果没有,您最推荐哪个 C# .NET 库? 解决方案
..
有什么方法可以使用 iPhone SDK 将语音转换为文本? 解决方案 是的,如果你是 谷歌, 龙,或 Siri.iPhone SDK 不提供对 iPhone 3GS 内置语音识别的任何访问,这显然是 没有太详细反正.最好的办法是找到一个可以上传音频片段进行分析的网络服务.
..
我的应用程序使用 AsyncTask 中的 MediaRecorder 类记录音频,并使用 Google API 将语音转换为文本 - 识别器意图 - 使用此问题中的代码:如何在安卓手机中没有烦人的对话框的情况下使用语音识别 我也尝试过在 Thread 中录制音频,但这是更糟糕的解决方案.它会导致更多的问题.我的问题是我的应用程序在模拟器上正常工作.但由于缺乏语音识别服务,模拟器不支持语音识
..
我想用 Python 为 Raspberry Pi 创建一个语音识别脚本,并且需要一个异步/连续语音识别库.异步意味着我需要无休止地运行识别,直到口语匹配到没有任何键盘输入的单词数组,然后将口语显示到终端并重新开始识别.我已经看过 PocketSphinx,但是经过几个小时的谷歌搜索,我没有找到任何关于异步识别的信息. 你知道有哪家图书馆能做到这一点吗? 解决方案 您可以在 Rasp
..
我使用以下代码在 Android 中启动语音识别: PackageManager pm = getPackageManager();列表活动 = pm.queryIntentActivities(new Intent(RecognizerIntent.ACTION_RECOGNIZE_SPEECH), 0);如果(活动.大小()== 0){displayWarning("此设备不支持语音识别")
..
我正在尝试使用 Google Speech API v2(地址 https://www.google.com/speech-api/v2/recognize?...) 我需要使用我的 Api 密钥,但是当我使用它时,我收到 error 403 Forbidden 当我使用我下载的示例项目中的 API 密钥时,它工作正常. 我在 Google Developers Console
..
我想尝试使用简单的语音命令(如“下一个"或“上一个")创建 jQuery 幻灯片.有没有办法使用谷歌的语音识别?我知道 Chrome 的 x-webkit-speech,但我必须点击一个按钮才能使用它. 我尝试过 MIT 的 WAMI,但我发现它比 Google 的语音认知更慢且准确率更低. 解决方案 截至今天,Chrome 已经存在:http://chrome.blogspot.c
..
我使用 Google 语音 Api v1 开发了一个应用程序 https://www.google.com/speech-api/v1/recognize?xjerr=1&client=chromium&lang="+language_code; 并且此链接用于获取响应.它工作正常,但从今天开始它不起作用.我没有从那个链接得到任何回应.任何人有任何想法?有没有替代链接?请帮忙 pr
..
我正在我的应用中实现语音识别.当我第一次向视图控制器展示语音识别逻辑时,一切正常.但是,当我再次尝试呈现视图控制器时,出现以下崩溃: 错误:[0x190bf000] >avae>AVAudioNode.mm:568: CreateRecordingTap: required 条件为 false: IsFormatSampleRateAndChannelCountValid(format)***
..
通过序列化,我的意思是输入的值以离散的时间间隔出现,并且向量的大小也事先未知.通常,神经网络采用固定大小并行输入神经元和固定大小并行输出神经元. 可在语音识别中使用序列化实现,其中我可以向网络提供波形的时间序列,并在输出端获取音素. 如果有人能指出一些现有的实现,那就太好了. 解决方案 简单的神经网络作为一种结构在时间尺度变形上没有不变性,这就是为什么将其应用于识别时间序列是不
..
我有一项服务,我在其中反复启动语音识别侦听器,以便我可以进行开放式会话供用户发言.该类还处理 Jelly Bean 中的问题,如果在 5 秒内没有听到任何语音,则会抛出 ERROR_SPEECH_TIMEOUT.所以基本上这是有效的.但是,如果我反复调用 identifyr.startListening(recognizerIntent) ,它会默默地失败,因为在这种情况下从未调用过 onBegi
..