speech-recognition相关内容

识别多人的声音

我正在寻找一种开源语音识别引擎,它可以确定谁在说话,而不是对口语做出​​反应.有谁知道我在哪里可以找到这样的东西? 解决方案 可以考虑 鲍勃·斯皮尔 https://pypi.python.org/pypi/bob.bio.spear 艾莉丝/米斯特拉尔 http://mistral.univ-avignon.fr/index_en.html matlab 中 ..
发布时间:2021-09-20 18:32:18 其他开发

开发者语音识别软件

文档终于说了,我需要在我的手腕上放松几个月.由于我是 .NET 开发人员,这可能会暂时结束我的生计,我并不急于这样做.也就是说,对于开发人员来说,是否有任何好的免提选项?有没有人成功使用过任何语音识别软件? POSTSCRIPT:我的手臂再次恢复到双手编程不成问题的程度.Dragon 自然是够用了,就是慢了点,不像键盘,我编程的速度比我想象的要快. 解决方案 它就在那里,并且有效.. ..

SAPI:语音转文本示例

我是 SAPI 的新手,如果你们中的任何人能为我提供 SAPI 中文本 Hello World 示例的演讲,我将不胜感激.我知道 MS 有一些例子,比如“听写"等,但我想从一个非常小的例子开始.很高兴您能提供帮助. 解决方案 我玩过一些使用 SAPI 的 Windows 语音识别,它确实不是用户友好的.这是我编写的代码示例(用 C++): #include #include #inclu ..

在 VBS 脚本中使用 SAPI 语音识别?

我发现了这个允许在 VBScript 中使用 Windows SAPI 文本到语音功能的单行示例: CreateObject("SAPI.SpVoice").Speak("这是一个测试") 我想知道 SAPI 语音识别是否可以以同样简单的方式在 VBScript 程序中使用.当我寻找此类信息时,出现的大量 SAPI 信息与 C++ 相关,例如 Microsoft SAPI 站点,或到 VBS ..
发布时间:2021-09-17 18:45:47 其他开发

我如何修复语法的语言与 vb 中语音识别器错误的语言不匹配

你好,visual basic 我正在尝试创建一个语音识别系统,它可以帮助我解决计算机上的问题.我打电话给我的助理贾维斯.对于这个项目,我导入了 system.speech.dll.现在我收到这个错误: 创建表单时出错.有关详细信息,请参阅 Exception.InnerException.错误是:语法的语言与语音识别器的语言不匹配. 这是我的代码 导入 System.Speech. ..

Android 语音识别与 Text to Speech 冲突

我已经根据此处给出的方法在我的应用程序中实现了连续语音识别:Android 语音识别持续服务.它本身工作得相当好. 但是,我想实现一个功能,应用程序正在使用文本到语音阅读网页,并且在阅读过程中,我想打开语音识别,以便我可以要求它停止使用语音.但是,我看到语音识别也开始识别文本到语音输出.有什么方法可以让它忽略手机发出的声音,只识别我在麦克风里说的话. 解决方案 您可以做的是在段落之间 ..
发布时间:2021-09-06 19:51:04 移动开发

在使用文本到语音之前停止语音识别

我正在实施一个使用语音识别和文本到语音的对话应用程序.我注意到,一旦启动识别器,它就会尝试识别任何声音,包括文本到语音的结果. 我尝试了下面的代码来阻止它收听 TTS,但我得到了这个异常: E/JavaBinder(29640): *** 未捕获的远程异常!(尚不支持跨进程的异常.)E/JavaBinder(29640): java.lang.RuntimeException: Speec ..
发布时间:2021-09-06 19:50:50 移动开发

Microsoft Sam,SAPI 替代品

我们有一个计划使用 Microsoft 语音 API 的应用程序.现在我们使用 Microsoft Sam 语音在 Windows XP 上对其进行了测试,坦率地说,这听起来很糟糕……几乎不可能听到声音想要说什么. 还有其他更好的声音吗?有没有更好的更新或更新版本.是否有其他产品、开源项目等可以作为替代方案? 澄清一下 - 它需要有某种 API,这样我才能真正针对它进行编程. 解 ..
发布时间:2021-09-06 19:50:16 C#/.NET

TTS *和*语音输入同时进行?

我注意到语音识别活动一开始,文本到语音的输出就会停止. 我理解其中的道理:语音识别引擎可能会“听到"TTS 输出并干扰其正常运行. 我的问题:这种行为是硬编码到系统中的,还是可以通过设置或参数(在 API 中)修改? 解决方案 Activity 是否必须同时使用识别和 TTS?如果识别可以等待(从功能上讲),则强制事件仅生成 RecognizerIntent onUtteran ..

语音转文本和文本转语音同时进行

简介 我正在开发一个应用程序,我需要在其中使用 Booth SpeechRecognizer 和 TTS.但是我在尝试这个时遇到了一些问题.主要是如果我初始化 TTS,SpeechRecgonizer 似乎不起作用,如果我禁用 TTS,那么 SpeechRecognizer 工作正常.接下来是带有相关代码的代码片段: 代码 public class GameActivity exte ..

C# SAPI 5.4 语言?

我已经制作了一个使用 SAPI 5.4 识别语音的简单程序,我想问一下我是否可以向 TTS 和 ASR 添加更多语言,谢谢这是我为您制作的代码,任何人都需要查看它 使用系统;使用 System.Collections.Generic;使用 System.ComponentModel;使用 System.Data;使用 System.Drawing;使用 System.Linq;使用 System ..
发布时间:2021-09-06 19:47:59 C#/.NET

在 iOS 中同时管理文本转语音和语音识别

我希望我的 iOS 应用程序使用文本到语音转换来向用户读取它从服务器接收到的一些信息,并且我还希望允许用户停止通过语音命令进行此类演讲.我已经尝试过像 OpenEars 这样的 iOS 语音识别框架,我发现问题在于它正在监听和检测应用程序本身“说"的信息,并且它干扰了用户语音命令的识别.> 是否有人在 iOS 中处理过这种情况并找到了解决方案?提前致谢 解决方案 实施起来不是一件小事.不 ..

Android(RecognitionListener) 实时语音转文本预览

我在我的应用程序中使用识别侦听器界面将语音转换为文本.但是,我想在我说话时立即显示语音转换后的文本.如果我说 4-5 个单词,那么我一说第一个单词就应该显示出来.总之就像谷歌助手.我目前正在覆盖它的 onresults 方法并在调用此方法时显示结果.有没有办法一次检测一个单词并一个一个显示出来? https://drive.google.com/open?id=0BxHdMJXrMP2HRk ..
发布时间:2021-09-06 19:47:10 移动开发

文本到语音(语音生成)和语音到文本(语音识别)API?

是否有针对桌面或浏览器环境的已知 API 的完整列表? 解决方案 我将重新整理并更新 C、Java 或 PHP 中的语音识别?.这绝不是全面的,但它可能是您的一个开始 通过几个月的观察这些问题,我看到大多数开发者的选择都是这样分解的: Windows 用户 - 使用 .Net 或 Microsoft.Speech 的 System.Speech 功能并安装 Microsoft ..

TimeDistributed with LSTM in keyword spotter

我正在开发一个关键字观察器,它处理音频输入并根据类似于此处显示的语音命令列表返回音频类:https://www.tensorflow.org/tutorials/audio/simple_audio 我希望能够处理多帧音频,而不是仅处理 1 秒的音频作为输入,例如 5 个时间步长和 10 毫秒步长,并将它们输入到机器学习模型中. 本质上,这相当于在我的网络之上添加一个 TimeDist ..
发布时间:2021-09-05 19:59:30 Python

使用 Tensorflow 的 Connectionist Temporal Classification (CTC) 实现

我试图在 contrib 包 (tf.contrib.ctc.ctc_loss) 下使用 Tensorflow 的 CTC 实现,但没有成功. 首先,有人知道我在哪里可以阅读好的分步教程吗?Tensorflow 的文档在这个主题上非常糟糕. 我是否必须向 ctc_loss 提供带有交错空白标签的标签? 即使使用长度为 1 的训练数据集超过 200 个时期,我也无法过度拟合我的网络.:( ..
发布时间:2021-09-05 19:08:31 其他开发