speech-recognition相关内容

语音识别和语音合成入门

我想开始学习语音识别和语音合成 在Prototype based on speech recognition 有人告诉我使用Microsoft语音服务器(SDK等) 当我有了这些,我如何编写应用程序,以及使用哪种编程语言(开发环境?)? 是否有使用Asterisk或SVOX的经验? 我需要做的是: 语音识别 语音合成 我不一定要很好地识别语音--我认为一开始30-50个单 ..
发布时间:2022-04-02 09:08:09 其他开发

如何向Microsoft SAPI添加自定义SR(语音识别)

我有一个用于语言X的语音识别应用程序。 Microsoft SAPI不支持此语言。如何将用于语言X的此SR添加到Microsoft SAPI,以便可以通过Microsoft SAPI使用它? 所以我想知道的是 我可以向Microsoft SAPI添加自定义SR吗? 如果是,如何操作? 如果这是一个复杂的过程,从哪里可以找到详细信息? 推荐答案 只是应用程序编程接口 ..
发布时间:2022-04-02 09:06:46 其他开发

在Windows中为Pocketsphinx设置Python

有人能帮我在Windows中构建Pocket Shinx语音识别吗?我在理解page中狮身人面像提供的指令时遇到了困难。 我想开发一个语音控制的计算机自动化应用程序,我使用的是Python。我不知道如何安装狮身人面像,以便可以将其导入到如下所示的Python环境中: import pocketsphinx as ps 但从中看不出任何东西。我可以在Ubuntu中轻松地使用 s ..
发布时间:2022-04-02 09:05:09 Python

语音识别,NodeJS

我目前正在开发一个工具,由于连接到不同的API,我可以阅读所有通知。 它工作得很好,但现在我想放一些语音命令来做一些操作。 就像当软件显示“一封来自Bob的邮件”时,我想说的是“阅读它”或“存档它”。 我的软件通过节点服务器运行,目前没有任何浏览器实现,但它可以是计划。 在节点JS中启用语音到文本的最佳方式是什么? 我在它上面看到了很多线程,但主要是使用浏览器,如果可 ..
发布时间:2022-04-01 23:59:45 其他开发

用于语音到文本转换的Python语音处理库

嘿 我希望建立一个代码在蟒蛇,将识别我通过麦克风说的话,并转换为语音, 你能给我几个有效的语音处理库来实现同样的效果吗? 推荐答案 参见pyspeech (python) - Transcribe mp3 files? ,其中谈到http://code.google.com/p/pyspeech/。您可能还想查看http://code.google.com/p/dragonfly ..
发布时间:2022-04-01 23:58:43 Python

如何通过Objective-C中的语音框架实现语音到文本的转换?

我想使用iOS语音框架在我的Objective-C应用程序中进行语音识别。 我找到了一些快速的例子,但在Objective-C中找不到任何东西。 是否可以从Objective-C访问此框架?如果是,如何? 推荐答案 花了足够的时间寻找Objective-C示例--甚至在苹果的文档中--我也找不到像样的东西,所以我自己找出来了。 头文件(.h) /*! * Im ..

语音识别与编程

有人在编程方面用过Dragon自然会说语音识别软件吗? 我想知道,因为我认为这会比我手工打字快得多,而且在我的碳水化合物隧道上打字更容易。 我每天都在VB6 IDE、VISUAL STUDIO 2008 IDE+团队资源管理器中编程,写电子邮件,通过Windows Live IM聊天。 我需要一个基于命令的界面,在其中我可以将语音命令绑定到击键,在拼写/说单词/说不带空格的单词之间切 ..
发布时间:2022-04-01 23:54:53 其他开发

只对数字(1到10000)进行语音识别的接口还是sdk?

我需要一个专门的解决方案来检测1到1000之间的数字,以便在智能手机上使用。 最好的解决方案是让这个SDK脱机工作。 有什么想法吗? 我找不到Google Speech或Amazon Transcribe的任何配置以允许“仅数字” 推荐答案 从人们那里得到数字是不太对的,即使你向他们要数字,他们通常也会说很多话,比如“我不知道”或“稍等一下”。您将严重损害体验。 您必须智能地分析 ..
发布时间:2022-04-01 23:52:48 其他开发

非英语语言的语音到文本转换

我正在尝试实现非英语语言的朴素语音到文本的转换。用户使用其他语言说话,而文本也使用相同的语言。这可能吗?如果是的话,有谁能帮助我们想出如何实施它的想法呢?如有任何帮助,我们将不胜感激。提前谢谢。 推荐答案 任何商业语音识别解决方案都不太可能支持梵文,因此您唯一的选择是将对梵文的支持添加到开源引擎(如CMUSphinx)中。 这非常简单,您实际上只需要按照文档操作,就可以切中要害。 ..
发布时间:2022-04-01 23:51:11 其他开发

基于语音识别的原型系统

我要创建一个基于自动语音识别的原型以处理报告。 需求现在还不确定,但首先我会得到一些虚拟数据集。 首先,我将专注于声学信号的输入和进一步的处理。 我真的不知道如何开始,哪种开发环境,编程语言,... 我更喜欢使用Visual Studio,因为我已经有许可证,但我对提议持开放态度。 您有没有一些教程、想法、经验? 推荐答案 (我正在重复使用最近发给朋友的一封电子 ..
发布时间:2022-04-01 23:49:34 其他开发

有人在生产中使用Google Speech API吗?

我找到了一些介绍如何使用Google Speech API的文章(http://mikepultz.com/2011/03/accessing-google-speech-api-chrome-11/)。 然而,这可靠吗?有人在生产中使用它吗? 谢谢 推荐答案 我的理解是,谷歌的语音网络服务只有在他们的Chrome浏览器或安卓操作系统上才能合法使用。你当然可以构建一个依赖于 ..
发布时间:2022-04-01 23:46:20 其他开发

PySpeech(Python)-转录MP3文件?

我想使用pySpeech API转录mp3(语音到文本)。不过,我不知道这是否可能。 是吗?如何? 推荐答案 我不知道关于pySpeech的事情,但如果它是微软Speech API的包装器,那么其他一些帖子可能会有帮助。 Microsoft语音引擎不需要麦克风输入。他们可以接受音频文件。 如果你在做抄写,你需要一本听写语法。听写语法包含在Windows 7和Vista附带 ..
发布时间:2022-04-01 23:44:14 Python

我可以使用语音识别来编写SQL吗?

我打字时手腕痛,我想开始使用语音识别编写SQL语句、存储过程和视图。 推荐答案 是。SQL非常适合语音识别(就像编程语言一样),因为它的词汇量和类似句子的结构都很有限。除了格式化SQL以使其看起来更美观之外,我口述它的速度比打字快得多。然而,口述代码并不适合每个人。一开始可能会非常令人沮丧。尝试并坚持这样做的人很可能是那些别无选择的人。 我使用的是Dragon NaturalyS ..

操作系统错误:没有可用的默认输入设备

我正在使用Python中的SpeechRecognition包尝试语音识别,但在尝试使用麦克风时遇到问题。 我测试了我的耳机的麦克风,它工作正常,正在被我的计算机检测到,但我的脚本抛出错误,好像没有连接麦克风一样。 在安装pyAudio后运行以下脚本时 $python -m speech_recognition 我收到以下错误: Traceback (most recen ..
发布时间:2022-04-01 23:39:44 Python

当一个人说话时,识别片段吗?

有谁知道一个(最好是C#.Net)库,可以让我在语音录音中定位特定人发言的片段? 推荐答案 工具包可以喊出:http://shout-toolkit.sourceforge.net/index.html 它是用C++编写的,并在Linux上进行了测试,但它也应该可以在Windows或OSX上运行。 该工具包是我在自动语音识别(ASR)博士研究中的副产品。将它用于ASR本身可 ..
发布时间:2022-04-01 23:38:30 其他开发

使用SAPI 5.3语音API进行声学培训

在Vista上使用Microsoft的SAPI 5.3语音API,如何编程进行RecoProfile的声学模型训练?更具体地说,如果您有一个文本文件和一个说出该文本的用户的音频文件,您会执行什么序列的SAPI调用以使用该文本和音频训练用户的配置文件? 更新: 有关此问题的详细信息我仍未解决: 您在";处调用ISpRecognizer2.SetTrainingState(true ..
发布时间:2022-04-01 23:36:04 其他开发