voice-recognition相关内容

为什么UWP连续语音识别停止

我有一个Windows 10 UWP应用程序,我正在为文本框启用语音识别。是的,我知道我也可以利用Cortana来解决这个问题。然而,Cortana也有一些缺点,主要是你几乎无法从应用程序中控制Cortana。 这就是持续识别SpeechRecognizer名称空间的用武之地。我喜欢我所拥有的控制力。然而,它似乎会在几秒钟后随机停止侦听。 以下是我如何实现它的。请注意,我还尝试将每个可 ..
发布时间:2022-09-06 14:47:12 C#/.NET

通过蓝牙进行安卓语音识别

我在我的活动中使用了语音识别,我刚刚意识到如果我连接了耳机,识别器仍然只能通过电话麦克风收听.有没有办法让它通过耳机听? 我确实注意到了这一点:http://developer.android.com/reference/android/bluetooth/BluetoothHeadset.html 但大部分方法直到 HoneyComb 才可用... 谢谢. 解决方案 基本上, ..
发布时间:2022-01-04 20:31:40 移动开发

谷歌的语音识别技术有API吗?

我想尝试使用简单的语音命令(如“下一个"或“上一个")创建 jQuery 幻灯片.有没有办法使用谷歌的语音识别?我知道 Chrome 的 x-webkit-speech,但我必须点击一个按钮才能使用它. 我尝试过 MIT 的 WAMI,但我发现它比 Google 的语音认知更慢且准确率更低. 解决方案 截至今天,Chrome 已经存在:http://chrome.blogspot.c ..

测量两个短音频相似度的最简单算法

问题是寻找任何开源或简单的实现来衡量 iOS 应用程序上两个音频之间的相似程度. 简单来说,音频可以用一维向量来表示,来计算一维向量之间的距离.但音频长度会有所不同,因此需要一些预处理等. 期待在这里得到一些线索,谢谢 解决方案 使用DTW可以高效计算两个变长序列之间的相似度: http://en.wikipedia.org/wiki/Dynamic_time_warpi ..
发布时间:2021-12-20 23:54:46 移动开发

Android中的声音识别

我希望我的 Android 应用能够识别声音.例如我想知道麦克风发出的声音是拍手声还是敲击声还是别的什么. 我需要使用数学吗,或者我可以为此使用一些库吗? 如果有任何用于声音分析的库,请告诉我.谢谢. 解决方案 Musicg 库对于哨声检测很有用.关于拍手,我不建议使用它,因为它会对每一个响亮的声音(甚至是说话)做出反应. 对于拍手和其他敲击声检测,我推荐 TarsosD ..
发布时间:2021-12-20 23:45:43 移动开发

Android:录音和保存音频

我正在开发的应用程序将记录用户的声音并将文件保存在 SD 卡上,然后允许用户再次收听音频. 我能够允许用户使用 RecognizerIntent 录制他的声音,但我无法弄清楚如何保存音频文件并允许用户听到音频.如果有人可以帮助我,我将不胜感激.我在下面显示了我的代码: //为音频按钮设置 onClickListenerattachVoice = (Button) findViewById( ..

ALSA lib pcm_hw.c:1667:(_snd_pcm_hw_open) 卡 arecord 的值无效:main:722:音频打开错误:没有那个文件或目录

我正在研究语音识别.为此,我正在使用“alsa-utils",但是当我尝试使用此脚本时 #!/bin/bashecho “正在录制……按 Ctrl+C 停止."arecord -D plughw:1,0 -q -f cd -t wav |ffmpeg -loglevel panic -y -i – -ar 16000 -acodec flac file.flac >/dev/null 2>&1 ..

这是什么错误-“IOError:[Errno 2] 没有这样的文件或目录:'audio.flac'",我正在尝试使用 google 语音识别 api for python

基本上我想将语音转换为文本,所以我尝试使用 google 语音识别 api for python. 这是我要运行的代码- from pygsr import Pygsr语音 = Pygsr()Speech.record(3) # 以秒为单位的持续时间 (3)短语,complete_response = Speech.speech_to_text('es_ES')打印短语#这是所需的输出 ..

这是什么错误-“IOError:[Errno 2] 没有这样的文件或目录:'audio.flac'",我正在尝试使用 google 语音识别 api for python

基本上我想将语音转换为文本,所以我尝试使用 google 语音识别 api for python. 这是我要运行的代码- from pygsr import Pygsr语音 = Pygsr()Speech.record(3) # 以秒为单位的持续时间 (3)短语,complete_response = Speech.speech_to_text('es_ES')打印短语#这是所需的输出 ..
发布时间:2021-11-24 23:01:55 C#

如何在 cmusphinx 上对土耳其语进行语音识别?

我导入了这个项目: https://github.com/cmusphinx/pocketsphinx-android-demo 它在 Android Studio 上运行良好. 但是正如您在教程中看到的那样,它具有英语语音识别功能.我怎样才能把它变成土耳其语?我搜索了很多,但找不到. 提前致谢. 解决方案 你必须按照教程自己训练模型 http://cmusp ..
发布时间:2021-11-21 20:56:14 移动开发

Applescript在输入后自动关闭对话框?

好的,所以我正在写一个苹果脚本来为我做一些语音控制操作. 我使用 Dragon Dictate 2.0 for mac 进行语音控制,主要使用 applescript 进行编码.除了一次小问题,我几乎把所有事情都解决了.当期待语音命令时,我让 applescript 显示一个对话框,供听写的文本使用. 例如. 将 cmd1 设置为返回的文本(显示对话框“Speak Command:" ..
发布时间:2021-11-16 21:49:36 其他开发

如何在 AppleScript 中将一系列单词转换为驼峰式大小写?

我正在尝试修改 Dragon Dictate,它可以使用一系列已经说出的单词来执行 AppleScript.我需要找出如何获取包含这些单词的字符串并将其转换为驼峰式大小写. 关于 srhandler(vars)将dictedText 设置为varDiddly 的vars说口述文本末端处理程序 因此,如果我设置一个宏来执行上述脚本,称为camel,并且我说“camel string with s ..

如何让applescript语音识别听任何单词?

我怎样才能让applescript 语音识别听任何单词?这是我目前所拥有的: 告诉应用程序“系统事件"使用 {command down} 击键 "c"结束告诉告诉应用程序“iCal"激活告诉应用程序“系统事件"使用 {command down} 击键“n"使用 {command down} 击键“v"击键返回结束告诉 我想替换第一行的副本来听任何单词. 解决方案 tell applic ..
发布时间:2021-11-16 21:47:37 其他开发

如何使用列表中的任何字符串作为变量?

我想知道如何让变量 A 成为来自 ListA 的任何随机字符串和来自 B 的任何随机字符串来自 ListB? 我想在语音助手中使用它,Voice 将是包含已识别句子的字符串.它应该对我在字符串 A 和字符串 B 之间所说的任何内容进行谷歌搜索. 导入重新导入浏览器ListA = [“搜索",“研究"]ListB = [“在谷歌上",“使用谷歌"]A = # ListA 中的任意字符串B = ..
发布时间:2021-09-20 18:34:02 Python

使用 VOICE_UPLINK 和 VOICE_DOWNLINK 进行通话录音

任何一个使用 AudioSource VOICE_UPLINK 和 VOICE_DOWNLINK 成功录制的通话. 我可以使用这些来源录制通话,但录制的声音并不清晰,我的意思是它听起来像是被拉长的声音. 还有一个问题:- 音频源 VOICE_CALL 从不工作时有什么用? 谢谢. 解决方案 实际上,VOICE_CALL 有效,至少对我在 Sony Xperia Z1 上是 ..
发布时间:2021-09-20 18:33:56 移动开发

语音识别算法是如何识别同音字的?

我之前也在思考这个问题.现代算法(特别是那些将语音转换为文本的算法)使用哪些线索来确定说的是哪个同音字(例如,to、too 或两个?) 他们是否使用上下文线索?句子的结构?也许每个单词的发音方式略有不同(例如,我通常在 two 中比在 to 中保持 o 音的时间更长).前两者的组合似乎最合理. 解决方案 他们是否使用上下文线索? 是的,ASR 系统使用填字游戏上下文.例如, ..
发布时间:2021-09-20 18:33:53 其他开发

Pocketsphinx Android 演示错误:“无法初始化识别器 java.io.IOException:无法初始化记录器.麦克风可能已经在使用中."

我一直在使用 Pocketsphinx Android 演示并收到错误消息:“无法初始化识别器 java.io.IOException:无法初始化录音机.麦克风可能已在使用中." 该错误是什么意思,我该怎么做才能修复它? 解决方案 如果您将 Android 操作系统升级到 6 或已经是 6,则必须在运行时请求许可.Android OS 6 之后,Android manifest re ..

语音搜索对话框准备好接受输入时的音频信号?

从您通过 startActivityForResult() 调用 Google 语音搜索的那一刻起,直到显示其对话框,准备好发表您的讲话,Google 语音搜索都会出现明显的延迟. 这要求用户在说话之前总是看着屏幕,等待显示的对话框. 最好在语音搜索准备好接受语音输入时添加“叮"声或其他一些非视觉提示. 这可能吗? 如果是这样,该怎么做? 解决方案 好的,这会使您的 ..
发布时间:2021-09-20 18:33:45 移动开发