cmusphinx相关内容

如何在 Ruby 应用程序中使用 CMU Sphinx 语音识别?

我正在寻找如何在 Ruby (Rails) 应用程序中使用 CMU Sphinx.我需要非常简单的任务 - 我有一个 mp3 文件,我想把它转录成文本. 如何实现这种最简单的方法?我不知道 C/C++,我的任务也不是为了它学习 C/C++ :) 感谢您的帮助! 解决方案 CMUSphinx 提供了多个可用于利用语音识别功能的界面.其中一些可能更适合您,一些不太适合: 使用 ..
发布时间:2021-07-11 20:59:32 其他开发

在 PocketSphinx 中使用不同的单词运行不同的命令

我已经找到了使用多个关键字激活 Pocketsphinx 的方法,但我想根据所说的关键字运行不同的命令.当我说“Alexa"时,我已经让它连接到亚马逊的 Alexa 服务器,现在我想在我说“TV Off"和“TV On"时添加一个命令. 解决方案 最好使用 python,类似这样: import sys, os从 pocketsphinx.pocketsphinx 进口 *从 sphin ..
发布时间:2021-07-02 20:25:55 其他开发

CMU Sphinx 是否可以通过 Maven 获得?

我有一个可能需要 CMU Sphinx 的应用的想法,是否可以通过 Maven 获得,还是需要手动添加? 解决方案 更新:CMUSphinx 将在一周左右的时间内在 sonatype 中可用.Maven 支持已经提交到 sphinx4 主干中. ..
发布时间:2021-06-02 18:49:05 Java开发

个别关键短语的分裂假设

我在Android应用中使用Pocketsphinx.我只有相对较小的一组命令可以独立识别,因此最终我使用了从文件中搜索关键字的方式,如下所示: one/1.0/已完成/1.0/在1e-10/上识别识别关闭/1e-10/ 实际列表不是英语的,因此为示例起见,可以任意选择这些关键字.我意识到这些阈值可能不是最佳阈值,而且简短的单词容易出现不匹配的情况. 此方法出现问题: @Over ..

怪异的口袋狮身人面像精度下降

一些背景信息-我正在使用jsgf语法为android创建一个Pocketsphinx应用程序(尽管问题仍然存在于fsg语法中).我的代码基于pocketsphinx demo for android . Pocketsphinx产生了一个奇怪的问题,即仅对引擎进行几次查询后,准确性似乎就下降了.第一个查询具有近乎完美的准确性-它可以毫无困难地识别相对复杂且令人费解的短语.但是,第二个和第三个 ..
发布时间:2021-04-04 20:16:58 Java开发

Pocketsphinx + Gstreamer竞赛条件? Pocketsphinx无法在Python脚本中同时收听音频+录音吗?

概述:因此,这是我最后一个问题的跟进工作( 问题:我的下一个问题似乎涉及一种微小的比赛情况,涉及我的麦克风已经在使用中,需要能够记录一些东西. 想象以下内容: 我启动了我的python守护进程,它目前正在监听. 我对着麦克风说话,然后问好Hello Scarlett(Pocketsphinx匹配关键字并立即开始记录所有输入) 应该将音频记录到/tmp/目录中的wav文件中,并且应该 ..

找不到Pocketsphinx gstreamer插件

我尝试通过 安装Pocketsphinx 酿造的内置cmu-pocketsphinx 和 进行安装(请按照以下说明进行操作: http://cmusphinx.sourceforge.net/wiki/gstreamer) pocketsphinx_continuous正常工作,但是我找不到 的可执行Pocketsphinx. gst检验Pocketsphinx ..
发布时间:2020-11-21 02:40:54 其他开发

如何在cmusphinx上对土耳其语进行语音识别?

我导入了这个项目: https://github.com/cmusphinx/pocketsphinx-android-demo 它在Android Studio上正常工作. 但是您可以在教程中看到它具有英语语音识别功能.如何将其转换为土耳其语?我搜索了很多,但找不到. 提前谢谢. 解决方案 您必须按照教程亲自训练模型 http://cmusphinx.sou ..
发布时间:2020-08-29 00:29:02 移动开发

在Mac OS X中设置PocketSphinx

我正在运行Enthought Python 2.7以及Mac OS 10.8.2中的默认Python 2.7,Xcode 4.5.1.我正在尝试在Python中开发语音转换为文本转换器.我使用Enthought Python,因为它允许我使用pyaudio在16000Hz, 1 Channel中进行记录,这是pocketsphinx正常工作所必需的. 我正在尝试使用brew install ..
发布时间:2020-08-14 23:26:02 Python

Android离线语音识别

我已经使用HTK(隐马尔可夫模型工具套件)来识别特定命令 曾经用来控制我的Android应用程序,但是在这种情况下,我需要将一些语音数据传递到服务器,这可能会花费更多时间. 为防止这种延迟,我正在考虑使用 pocketsphinx 来本地识别语音数据使用Android应用程序,这样我就无需将音频传递到服务器. 如果这是一个好主意,是否容易从头开始学习Pocketsphinx?另外,这两 ..
发布时间:2020-07-23 05:24:34 其他开发

我想在Sphinx4中使用自己的语法文件或hello world demo更新的语法文件

实际上,您好,世界演示示例中有几个单词,但我想在其中添加更多单词.似乎可以通过两种方式进行. 1.更新hello.gram文件 2.创建我自己的gram文件. 但是问题是我无法选择任何一种方式.你能帮我吗.谢谢你的时间.对不起,英语不好. 这是我更新的hello.gram文件.我没有更新其他文件.请这种方式帮助我. hello.gram文件 #JSGF V1.0; /** * J ..
发布时间:2020-07-08 19:40:37 Java开发

sphinx-4 NullPointerException在startRecognition

我正在尝试遵循本教程,它在启动后由于很多原因而崩溃字典和模型出现问题,例如. The dictionary is missing a phonetic transcription for the word 'humphrey' 和 Dec 18, 2014 1:14:50 PM edu.cmu.sphinx.linguist.lextree.HMMTree addPronunci ..
发布时间:2020-07-08 19:39:31 其他开发

sphinx4中的大词汇量语音识别

据我所知,sphinx4需要语法来识别单词.无论如何,有没有不使用语法规则就获得输入的东西,那不是语法中的东西,有点像我在命令,它会写出我要说的话? 解决方案 据我所知,sphinx4需要语法来识别单词. 不,sphinx4支持大词汇量语音识别 总有没有不使用语法规则就获取输入的信息,那不在语法中,有点像我在命令,它会写出我要说的话?还是有任何算法可以检查它? 您需要 ..
发布时间:2020-07-08 19:38:28 其他开发

狮身人面像中的一轮迭代后麦克风未启动

我正在使用CMU狮身人面像库,但成功运行一次迭代后,出现此错误“无法打开格式为PCM_SIGNED 16000.0 Hz,16位,单声道,2字节/帧,不支持big-endian的麦克风行."无法启动麦克风.在ubuntu 12.10中的eclipse上运行时,代码在所有迭代中均能正常工作.为什么在Windows 7中使用Eclipse时会出现此错误? 解决方案 如果您的config xml ..
发布时间:2020-07-08 19:38:24 其他开发

sphinx4的语音识别响应较差

当前,我们正在研究使用sphinx4进行语音识别.我们正在努力为听写类型的应用程序提供良好的响应.输入的是wav文件,我们希望将其转录.我研究了Sphinx4提供的LatticeDemo和Transcriber演示.当我使用相同的配置时,响应非常差.我试图调整配置文件,但它根本无法识别单词.提供的转录演示是针对数字的,我已经修改了配置文件以理解单词.但是我不确定我是否想念一些东西.我已经附上了配置 ..
发布时间:2020-07-08 19:37:12 其他开发

属性异常组件:'wsjLoader'

最近几天,我读了很多有关修改HelloWorld演示文件的信息.根据自己的选择在其中添加新词.但是我遇到了一个严重的问题,我无法解决.我正在列出我的步骤&然后错误程序给了我. 任何帮助深表感谢! 首先,我提取了WSJ_8gau_13dCep_16k_40mel_130Hz_6800Hz jar文件.然后,我添加了一些新单词& cmudict.0.6d文件中它们的发音.保存后使用jar文件制作 ..
发布时间:2020-07-08 19:36:08 其他开发

使用Sphinx4进行听写应用

我的要求类似于此问题,因为问题现在已经3岁了,我要重新发布该问题,并附带我的特定信息,我想创建一个应用程序,该应用程序使用.wav(或任何其他标准音频文件格式)并将其转换为文本. 对于语音识别,我决定使用sphinx4,我正在尝试增强sphinx随附的Transcriber演示.它很好,但是仅适用于特定的语法(以.gram和.gxml文件编写). 编辑 能够与英语一起使用吗?我正在尝试 ..
发布时间:2020-07-08 19:36:06 其他开发