voice-recognition相关内容
我有一个Windows 10 UWP应用程序,我正在为文本框启用语音识别。是的,我知道我也可以利用Cortana来解决这个问题。然而,Cortana也有一些缺点,主要是你几乎无法从应用程序中控制Cortana。 这就是持续识别SpeechRecognizer名称空间的用武之地。我喜欢我所拥有的控制力。然而,它似乎会在几秒钟后随机停止侦听。 以下是我如何实现它的。请注意,我还尝试将每个可
..
我在我的活动中使用了语音识别,我刚刚意识到如果我连接了耳机,识别器仍然只能通过电话麦克风收听.有没有办法让它通过耳机听? 我确实注意到了这一点:http://developer.android.com/reference/android/bluetooth/BluetoothHeadset.html 但大部分方法直到 HoneyComb 才可用... 谢谢. 解决方案 基本上,
..
我想尝试使用简单的语音命令(如“下一个"或“上一个")创建 jQuery 幻灯片.有没有办法使用谷歌的语音识别?我知道 Chrome 的 x-webkit-speech,但我必须点击一个按钮才能使用它. 我尝试过 MIT 的 WAMI,但我发现它比 Google 的语音认知更慢且准确率更低. 解决方案 截至今天,Chrome 已经存在:http://chrome.blogspot.c
..
问题是寻找任何开源或简单的实现来衡量 iOS 应用程序上两个音频之间的相似程度. 简单来说,音频可以用一维向量来表示,来计算一维向量之间的距离.但音频长度会有所不同,因此需要一些预处理等. 期待在这里得到一些线索,谢谢 解决方案 使用DTW可以高效计算两个变长序列之间的相似度: http://en.wikipedia.org/wiki/Dynamic_time_warpi
..
我希望我的 Android 应用能够识别声音.例如我想知道麦克风发出的声音是拍手声还是敲击声还是别的什么. 我需要使用数学吗,或者我可以为此使用一些库吗? 如果有任何用于声音分析的库,请告诉我.谢谢. 解决方案 Musicg 库对于哨声检测很有用.关于拍手,我不建议使用它,因为它会对每一个响亮的声音(甚至是说话)做出反应. 对于拍手和其他敲击声检测,我推荐 TarsosD
..
我正在开发的应用程序将记录用户的声音并将文件保存在 SD 卡上,然后允许用户再次收听音频. 我能够允许用户使用 RecognizerIntent 录制他的声音,但我无法弄清楚如何保存音频文件并允许用户听到音频.如果有人可以帮助我,我将不胜感激.我在下面显示了我的代码: //为音频按钮设置 onClickListenerattachVoice = (Button) findViewById(
..
我正在研究语音识别.为此,我正在使用“alsa-utils",但是当我尝试使用此脚本时 #!/bin/bashecho “正在录制……按 Ctrl+C 停止."arecord -D plughw:1,0 -q -f cd -t wav |ffmpeg -loglevel panic -y -i – -ar 16000 -acodec flac file.flac >/dev/null 2>&1
..
基本上我想将语音转换为文本,所以我尝试使用 google 语音识别 api for python. 这是我要运行的代码- from pygsr import Pygsr语音 = Pygsr()Speech.record(3) # 以秒为单位的持续时间 (3)短语,complete_response = Speech.speech_to_text('es_ES')打印短语#这是所需的输出
..
基本上我想将语音转换为文本,所以我尝试使用 google 语音识别 api for python. 这是我要运行的代码- from pygsr import Pygsr语音 = Pygsr()Speech.record(3) # 以秒为单位的持续时间 (3)短语,complete_response = Speech.speech_to_text('es_ES')打印短语#这是所需的输出
..
我导入了这个项目: https://github.com/cmusphinx/pocketsphinx-android-demo 它在 Android Studio 上运行良好. 但是正如您在教程中看到的那样,它具有英语语音识别功能.我怎样才能把它变成土耳其语?我搜索了很多,但找不到. 提前致谢. 解决方案 你必须按照教程自己训练模型 http://cmusp
..
好的,所以我正在写一个苹果脚本来为我做一些语音控制操作. 我使用 Dragon Dictate 2.0 for mac 进行语音控制,主要使用 applescript 进行编码.除了一次小问题,我几乎把所有事情都解决了.当期待语音命令时,我让 applescript 显示一个对话框,供听写的文本使用. 例如. 将 cmd1 设置为返回的文本(显示对话框“Speak Command:"
..
我正在尝试修改 Dragon Dictate,它可以使用一系列已经说出的单词来执行 AppleScript.我需要找出如何获取包含这些单词的字符串并将其转换为驼峰式大小写. 关于 srhandler(vars)将dictedText 设置为varDiddly 的vars说口述文本末端处理程序 因此,如果我设置一个宏来执行上述脚本,称为camel,并且我说“camel string with s
..
我怎样才能让applescript 语音识别听任何单词?这是我目前所拥有的: 告诉应用程序“系统事件"使用 {command down} 击键 "c"结束告诉告诉应用程序“iCal"激活告诉应用程序“系统事件"使用 {command down} 击键“n"使用 {command down} 击键“v"击键返回结束告诉 我想替换第一行的副本来听任何单词. 解决方案 tell applic
..
我使用的是 S8/S8+.我想从 Intent 调用 bibxy 应用程序.但是,我不能调用它.我如何从 Intent 调用它? 这是我的尝试 final String SVOICE_PACKAGE_NAME = "com.samsung.voiceserviceplatform";最终意图意图 = 新意图();intent.setPackage(SVOICE_PACKAGE_NAME);
..
我想知道如何让变量 A 成为来自 ListA 的任何随机字符串和来自 B 的任何随机字符串来自 ListB? 我想在语音助手中使用它,Voice 将是包含已识别句子的字符串.它应该对我在字符串 A 和字符串 B 之间所说的任何内容进行谷歌搜索. 导入重新导入浏览器ListA = [“搜索",“研究"]ListB = [“在谷歌上",“使用谷歌"]A = # ListA 中的任意字符串B =
..
我尝试将语音识别添加到我的应用中.但不幸的是,我没有找到添加通用占位符的方法.例如我想说“我正在寻找 stackoverflow"然后我使用这个语法: 我是寻找听 我的问题是,如何实现对“stackoverfl
..
任何一个使用 AudioSource VOICE_UPLINK 和 VOICE_DOWNLINK 成功录制的通话. 我可以使用这些来源录制通话,但录制的声音并不清晰,我的意思是它听起来像是被拉长的声音. 还有一个问题:- 音频源 VOICE_CALL 从不工作时有什么用? 谢谢. 解决方案 实际上,VOICE_CALL 有效,至少对我在 Sony Xperia Z1 上是
..
我之前也在思考这个问题.现代算法(特别是那些将语音转换为文本的算法)使用哪些线索来确定说的是哪个同音字(例如,to、too 或两个?) 他们是否使用上下文线索?句子的结构?也许每个单词的发音方式略有不同(例如,我通常在 two 中比在 to 中保持 o 音的时间更长).前两者的组合似乎最合理. 解决方案 他们是否使用上下文线索? 是的,ASR 系统使用填字游戏上下文.例如,
..
我一直在使用 Pocketsphinx Android 演示并收到错误消息:“无法初始化识别器 java.io.IOException:无法初始化录音机.麦克风可能已在使用中." 该错误是什么意思,我该怎么做才能修复它? 解决方案 如果您将 Android 操作系统升级到 6 或已经是 6,则必须在运行时请求许可.Android OS 6 之后,Android manifest re
..
从您通过 startActivityForResult() 调用 Google 语音搜索的那一刻起,直到显示其对话框,准备好发表您的讲话,Google 语音搜索都会出现明显的延迟. 这要求用户在说话之前总是看着屏幕,等待显示的对话框. 最好在语音搜索准备好接受语音输入时添加“叮"声或其他一些非视觉提示. 这可能吗? 如果是这样,该怎么做? 解决方案 好的,这会使您的
..