speech-recognition相关内容

在 bindService 方法之后从未调用 onServiceConnected

我有一个特殊情况:由广播接收器启动的服务启动一个活动.我想让此活动能够与服务进行通信.我选择使用 AIDL 使其成为可能.除了在活动的 onCreate() 中调用的 bindService() 方法外,一切似乎都运行良好.事实上,bindService() 会抛出一个空指针异常,因为 onServiceConnected() 永远不会被调用,而服务的 onBind() 方法是.无论如何 bind ..
发布时间:2021-12-27 20:58:40 移动开发

Android语音识别持续服务

我正在尝试创建一个服务来在 Android 4.2 中运行连续语音识别.使用此链接中的答案( Android语音识别作为 Android 4.1 & 4.2 上的一项服务,我创建了一个从 Activity 运行的服务.我的问题是在 handleMessage 方法中访问 mTarget.mAudioManager 或 mTarget.mSpeechRecognizerIntent 时出现空异常.目 ..
发布时间:2021-12-27 20:53:11 移动开发

Google-speech-api 错误地转录语音数字

我开始使用谷歌语音 api 转录音频. 正在转录的音频包含许多一个接一个说出的数字. 例如273 298 但转录返回 270-3298 我的猜测是它会将其解释为某种电话号码. 我想要的是未解析的输出,例如“2 73 2 98",我可以自己处理和解析. 有没有设置或者支持这种东西? 谢谢 解决方案 所以我遇到了完全相同的问题,我认为我们找到了解决方案 ..

使用 Flash 或 Silverlight 进行语音识别

我正在开发一个网络用户界面来输入一些不是很复杂但需要实时加载的信息.我认为该应用程序可以利用语音识别来简化任务. 界面的核心是使用 Javascript 和 jQuery 构建的,但可以轻松包含 flash 或 silverlight 组件.我相信这可能是要走的路... 我不需要识别用户说的所有内容,只需要识别一些预先录制的命令.此外,我不希望用户单击按钮来指定语音命令的开始和结束.应 ..
发布时间:2021-12-20 18:19:58 其他开发

如何在我的 Flask 应用程序中连接浏览器的麦克风?

我使用语音识别模块通过语音识别搜索查询,然后打开谷歌浏览器页面显示查询结果.基本上,它是谷歌语音搜索的替代品,但它是通过终端启动的.但我想把它变成一个网络应用程序.我创建了烧瓶应用程序: -搜索(目录) -search.py​​(直接使用终端打开标签/独立工作)-app.py(主烧瓶应用程序)-静态(目录)-模板(目录) 但由于应用程序托管在服务器上,我的 search.py​​ 从服务 ..
发布时间:2021-12-15 15:11:50 Python

从音频文件而不是麦克风识别语音

如何对来自音频文件(.mp3、wav)而不是麦克风的语音进行语音识别? 我希望能够从 C#.NET 和 Delphi 中做到这一点. 解决方案 这篇文章专门回答你的问题: 在 SR 引擎中使用 WAV 文件输入 http://msdn.microsoft.com/en-us/library/ms717071(VS.85).aspx 有关一般信息,请参阅以下文章: ..
发布时间:2021-12-13 23:43:47 C#/.NET

将输入流式传输到 System.Speech.Recognition.SpeechRecognitionEngine

我正在尝试从 TCP 套接字在 C# 中进行“流式"语音识别.我遇到的问题是 SpeechRecognitionEngine.SetInputToAudioStream() 似乎需要一个可以搜索的定义长度的流.现在我能想到的唯一方法是在有更多输入时在 MemoryStream 上重复运行识别器. 这里有一些代码来说明: SpeechRecognitionEngine appRecogni ..
发布时间:2021-12-11 11:15:36 C#/.NET

从数据中获取 FFT 峰值

我正在使用 Octave 从头开始​​开发语音识别系统.我试图通过检测频率差异来检测音素.目前我已经读入了一个 wav 文件,将值组织成块并将 fft 应用于整体数据.之后,我用 plot(abs(real(fft(q)))) 绘制新数据,它创建了这个图: 如何获得频率值(图表的峰值)? 解决方案 如果您无法访问 findpeaks,那么其工作原理的基本前提是,对于信号中的每个点,它 ..
发布时间:2021-12-08 14:31:25 其他开发

System.Speech.Recognition 和 Microsoft.Speech.Recognition 有什么区别?

.NET 中有两个类似的命名空间和程序集用于语音识别.我正在尝试了解这些差异以及何时适合使用其中一种. 有 System.Speech.Recognition 来自程序集 System.Speech(在 System.Speech.dll 中).System.Speech.dll 是 .NET Framework 类库 3.0 及更高版本中的核心 DLL 还有来自程序集 Microso ..
发布时间:2021-12-02 13:40:14 C#/.NET

Android 语音识别即 Android 4.1 & 上的一项服务4.2

我已经成功地将连续语音识别(使用 SpeechRecognizer 类)作为一项服务在所有 Android 版本(最高 4.1)上运行.我的问题涉及让它在 4.1 和 4.2 版上工作,因为众所周知,存在一个问题,即在语音识别开始几秒钟后,API 没有按照文档中的说明执行,如果没有检测到语音输入,则它就像如果语音识别器无声地死亡.(http://code.google.com/p/android/ ..
发布时间:2021-12-01 11:59:10 移动开发

Google Keep 如何在保存录音的同时进行语音识别?

Android 的 SpeechRecognizer 显然不允许将您进行语音识别的输入记录到音频文件中.也就是说,您要么使用 MediaRecorder(或 AudioRecord)录制语音,要么使用 SpeechRecognizer 进行语音识别,在这种情况下,音频不会记录到文件中(至少不是您可以访问的文件);但你不能同时进行. 在Android中如何实现录音和语音识别同时进行的问题已经被 ..

语音识别:AttributeError:模块“speech_recognition"没有属性“Recognizer"

我正在尝试使用 语音识别项目 运行语音识别 我如图所示安装了 SpeechRecognition.我的代码正确运行了几次. 我试图输入不同的文件.现在我开始收到以下错误: 将speech_recognition导入为sr回溯(最近一次调用最后一次):文件“",第 1 行,在 中导入语音识别为 sr文件“/Us ..
发布时间:2021-11-30 15:35:08 Python

用于检测人声、性别、年龄和情绪的音频分析——之前做过任何开源工作吗?

在“音频分析"领域是否有先前的开源工作来检测人声(比如尽管有一些背景噪音),确定说话者的性别,可能确定否.演讲者的数量、演讲者的年龄以及演讲者的情绪? 我的预感是,像 CMU Sphinx 这样的语音识别软件可能是一个不错的起点,但如果有更好的东西,那就太好了. 解决方案 我是一名从事语音识别研究的研究生.这些都是开放的研究问题,不幸的是,我不知道可以开箱即用的开源软件包. 如 ..
发布时间:2021-11-27 11:59:59 其他开发

ALSA lib pcm_hw.c:1667:(_snd_pcm_hw_open) 卡 arecord 的值无效:main:722:音频打开错误:没有那个文件或目录

我正在研究语音识别.为此,我正在使用“alsa-utils",但是当我尝试使用此脚本时 #!/bin/bashecho “正在录制……按 Ctrl+C 停止."arecord -D plughw:1,0 -q -f cd -t wav |ffmpeg -loglevel panic -y -i – -ar 16000 -acodec flac file.flac >/dev/null 2>&1 ..

如何在没有 Amazon Echo 设备的情况下使用 Amazon Skill Set

我正在尝试在我的网站中集成 amazon 技能套件,而没有 amazon 回声单元.我想使用笔记本电脑/PC 麦克风而不是回声装置在我的网站上执行语音命令. 我已经使用了本教程,但我没有找到任何关于如何实施它的信息在我这边. 我还尝试了 github 上提供的这些示例.但我认为这些也需要亚马逊回声设备:https://github.com/amzn/alexa-skills-kit-j ..

Android:阿拉伯语语音识别 - 离线

任何人都可以帮助我或给我有关阿拉伯语语音识别的线索 - 适用于 android 的离线功能吗? 我想开发一个简单的应用程序来进行语音识别 - 离线做这个在线我知道如何......如果有人有建议或链接到一个开源项目甚至图书馆来购买,那么高效地做到这一点将是惊人的. 提前致谢. 解决方案 使用 intent.putExtra(RecognizerIntent.EXTRA_LANG ..

非语音噪音或声音识别软件?

我正在开发一些面向儿童的软件,并希望为该软件添加响应多种非语音声音的功能.例如,拍手、吠叫、吹口哨、放屁声等. 我过去使用过 CMU Sphinx 和 Windows Speech API,但是,据我所知,这两者都不支持非语音噪音,事实上我相信会主动过滤掉它们. > 总的来说,我正在寻找“我如何获得此功能",但我怀疑如果我将其分解为三个问题(我猜测接下来要搜索的内容)可能会有所帮助: ..
发布时间:2021-11-15 02:08:07 其他开发

语音识别API

我需要自动转录一些简短的 MP3,作为我正在处理的概念证明的一部分.我目前正在研究云解决方案或 Web API 服务,以将 MP3 作为简单的 HTTP 请求发送并接收转录. 我在此处找到的唯一免费/开源解决方案,但演示似乎不起作用(至少不是我需要转录的文件).我为呼叫中心找到了一些企业解决方案,但到目前为止我还没有可以简单地集成到项目中. 是否有任何基于网络的语音识别服务可用?能够滤 ..
发布时间:2021-11-15 00:43:18 其他开发