cmusphinx相关内容
我正在寻找如何在 Ruby (Rails) 应用程序中使用 CMU Sphinx.我需要非常简单的任务 - 我有一个 mp3 文件,我想把它转录成文本. 如何实现这种最简单的方法?我不知道 C/C++,我的任务也不是为了它学习 C/C++ :) 感谢您的帮助! 解决方案 CMUSphinx 提供了多个可用于利用语音识别功能的界面.其中一些可能更适合您,一些不太适合: 使用
..
我已经找到了使用多个关键字激活 Pocketsphinx 的方法,但我想根据所说的关键字运行不同的命令.当我说“Alexa"时,我已经让它连接到亚马逊的 Alexa 服务器,现在我想在我说“TV Off"和“TV On"时添加一个命令. 解决方案 最好使用 python,类似这样: import sys, os从 pocketsphinx.pocketsphinx 进口 *从 sphin
..
我一直在尝试在我的 PC 上设置 CMU-Sphinx4,以便使用语音识别制作应用程序.我能够设置大部分部件和配置并尝试运行 Sphinx 提供的 HelloWorld 应用程序,但在 recognizer.allocate(); 处遇到了 NullPointerExcetption.> 完整的堆栈跟踪: 12:34:45.501 WARNING 字典缺少词:12:34:45.517
..
我有一个可能需要 CMU Sphinx 的应用的想法,是否可以通过 Maven 获得,还是需要手动添加? 解决方案 更新:CMUSphinx 将在一周左右的时间内在 sonatype 中可用.Maven 支持已经提交到 sphinx4 主干中.
..
我有这个使用Pocketsphinx的VAD元素的管道: Gst.parse_launch(“" pulsesrc设备= \"alsa_input.usb-046d_08c9_674634A4-02-U0x46d0x8c9.analog-mono \""+“!vader name = vad auto-threshold = true" +“!level name = wavelevel int
..
我在Android应用中使用Pocketsphinx.我只有相对较小的一组命令可以独立识别,因此最终我使用了从文件中搜索关键字的方式,如下所示: one/1.0/已完成/1.0/在1e-10/上识别识别关闭/1e-10/ 实际列表不是英语的,因此为示例起见,可以任意选择这些关键字.我意识到这些阈值可能不是最佳阈值,而且简短的单词容易出现不匹配的情况. 此方法出现问题: @Over
..
一些背景信息-我正在使用jsgf语法为android创建一个Pocketsphinx应用程序(尽管问题仍然存在于fsg语法中).我的代码基于pocketsphinx demo for android . Pocketsphinx产生了一个奇怪的问题,即仅对引擎进行几次查询后,准确性似乎就下降了.第一个查询具有近乎完美的准确性-它可以毫无困难地识别相对复杂且令人费解的短语.但是,第二个和第三个
..
概述:因此,这是我最后一个问题的跟进工作( 问题:我的下一个问题似乎涉及一种微小的比赛情况,涉及我的麦克风已经在使用中,需要能够记录一些东西. 想象以下内容: 我启动了我的python守护进程,它目前正在监听. 我对着麦克风说话,然后问好Hello Scarlett(Pocketsphinx匹配关键字并立即开始记录所有输入) 应该将音频记录到/tmp/目录中的wav文件中,并且应该
..
我尝试通过 安装Pocketsphinx 酿造的内置cmu-pocketsphinx 和 进行安装(请按照以下说明进行操作: http://cmusphinx.sourceforge.net/wiki/gstreamer) pocketsphinx_continuous正常工作,但是我找不到 的可执行Pocketsphinx. gst检验Pocketsphinx
..
这是原始代码: #include #include #include #如果已定义(_WIN32)&& !defined(__ CYGWIN__) #include #else #include #endif #include
..
我导入了这个项目: https://github.com/cmusphinx/pocketsphinx-android-demo 它在Android Studio上正常工作. 但是您可以在教程中看到它具有英语语音识别功能.如何将其转换为土耳其语?我搜索了很多,但找不到. 提前谢谢. 解决方案 您必须按照教程亲自训练模型 http://cmusphinx.sou
..
我正在运行Enthought Python 2.7以及Mac OS 10.8.2中的默认Python 2.7,Xcode 4.5.1.我正在尝试在Python中开发语音转换为文本转换器.我使用Enthought Python,因为它允许我使用pyaudio在16000Hz, 1 Channel中进行记录,这是pocketsphinx正常工作所必需的. 我正在尝试使用brew install
..
我已经使用HTK(隐马尔可夫模型工具套件)来识别特定命令 曾经用来控制我的Android应用程序,但是在这种情况下,我需要将一些语音数据传递到服务器,这可能会花费更多时间. 为防止这种延迟,我正在考虑使用 pocketsphinx 来本地识别语音数据使用Android应用程序,这样我就无需将音频传递到服务器. 如果这是一个好主意,是否容易从头开始学习Pocketsphinx?另外,这两
..
实际上,您好,世界演示示例中有几个单词,但我想在其中添加更多单词.似乎可以通过两种方式进行. 1.更新hello.gram文件 2.创建我自己的gram文件. 但是问题是我无法选择任何一种方式.你能帮我吗.谢谢你的时间.对不起,英语不好. 这是我更新的hello.gram文件.我没有更新其他文件.请这种方式帮助我. hello.gram文件 #JSGF V1.0; /** * J
..
我正在尝试遵循本教程,它在启动后由于很多原因而崩溃字典和模型出现问题,例如. The dictionary is missing a phonetic transcription for the word 'humphrey' 和 Dec 18, 2014 1:14:50 PM edu.cmu.sphinx.linguist.lextree.HMMTree addPronunci
..
据我所知,sphinx4需要语法来识别单词.无论如何,有没有不使用语法规则就获得输入的东西,那不是语法中的东西,有点像我在命令,它会写出我要说的话? 解决方案 据我所知,sphinx4需要语法来识别单词. 不,sphinx4支持大词汇量语音识别 总有没有不使用语法规则就获取输入的信息,那不在语法中,有点像我在命令,它会写出我要说的话?还是有任何算法可以检查它? 您需要
..
我正在使用CMU狮身人面像库,但成功运行一次迭代后,出现此错误“无法打开格式为PCM_SIGNED 16000.0 Hz,16位,单声道,2字节/帧,不支持big-endian的麦克风行."无法启动麦克风.在ubuntu 12.10中的eclipse上运行时,代码在所有迭代中均能正常工作.为什么在Windows 7中使用Eclipse时会出现此错误? 解决方案 如果您的config xml
..
当前,我们正在研究使用sphinx4进行语音识别.我们正在努力为听写类型的应用程序提供良好的响应.输入的是wav文件,我们希望将其转录.我研究了Sphinx4提供的LatticeDemo和Transcriber演示.当我使用相同的配置时,响应非常差.我试图调整配置文件,但它根本无法识别单词.提供的转录演示是针对数字的,我已经修改了配置文件以理解单词.但是我不确定我是否想念一些东西.我已经附上了配置
..
最近几天,我读了很多有关修改HelloWorld演示文件的信息.根据自己的选择在其中添加新词.但是我遇到了一个严重的问题,我无法解决.我正在列出我的步骤&然后错误程序给了我. 任何帮助深表感谢! 首先,我提取了WSJ_8gau_13dCep_16k_40mel_130Hz_6800Hz jar文件.然后,我添加了一些新单词& cmudict.0.6d文件中它们的发音.保存后使用jar文件制作
..
我的要求类似于此问题,因为问题现在已经3岁了,我要重新发布该问题,并附带我的特定信息,我想创建一个应用程序,该应用程序使用.wav(或任何其他标准音频文件格式)并将其转换为文本. 对于语音识别,我决定使用sphinx4,我正在尝试增强sphinx随附的Transcriber演示.它很好,但是仅适用于特定的语法(以.gram和.gxml文件编写). 编辑 能够与英语一起使用吗?我正在尝试
..