cmusphinx相关内容

建立新的声学模型,字典,语言模型以实现不常见的语言语音识别

我想为"Sinhala Language speech recognition"僧伽罗语语言建立新的声学模型,新的词典,新的语言模型字符是基于Unicode的.例如A =අ,I =ඉ,U =උ,KA =ක,BA =බ. 我确实浏览过 CMUSphinx开发人员指南.但这并没有帮助我.它适用于英语. 语言模型应为ARPA模型.以及如何用英语音素映射Sinhala Unicode以及如何用不同的 ..
发布时间:2020-07-08 19:36:01 其他开发

Python无法使用Gstreamer访问USB麦克风以在Raspberry Pi上使用Pocketsphinx执行语音识别

因此python的行为就像是根本听不到麦克风传来的声音一样. 这是问题所在.我有一个 Python (2.7)脚本,该脚本假定正在使用 Gstreamer 来访问我的麦克风并通过 Pocketsphinx 为我做语音识别.我正在使用 Pulse Audio ,而我的设备是 Raspberry Pi .我的麦克风是 Playstation 3 Eye . 立即开始,我已经获得了pocke ..
发布时间:2020-07-04 20:11:14 Python

如何减少Sphinx4应用程序中的噪声

我对Sphinx4和语音识别系统是陌生的.我正在使用sphinx4创建语音应用程序.问题是噪声,即使没有用户的语音输入也导致程序识别,即即使用户没有语音输入也将语音转换为文本,从而影响准确性. 主要问题是如何实现降噪.这是因为即使我对麦克风什么也没说,系统仍会检测到输入.所以我想这是因为噪音. 我在网上检查了降噪功能,但几乎没有清楚的信息.尽管Internet上有一些有关sphinx4 ..
发布时间:2020-07-01 19:44:16 其他开发

CMU Sphinx4-自定义语言模型

我有一个非常具体的要求.我正在开发一个应用程序,该应用程序将允许用户在应用程序中说出HN56C12345格式的员工编号(任何字母数字字符序列).我已经通过链接: http://cmusphinx.sourceforge.net/wiki/tutoriallm 但我不确定这是否适用于我的用例. 所以我的问题是三个方面: 在我的情况下,Sphinx4能否真正识别出像emp一样的高精度字母数 ..
发布时间:2020-06-29 19:26:23 其他开发

创建50,000个单词的ARPA语言模型文件

我想创建一个包含将近50,000个单词的ARPA语言模型文件.我无法通过将文本文件传递给CMU语言工具来生成语言模型.是否有其他链接可以用来为这些许多单词提供语言模型? 解决方案 我认为我会回答这个问题,因为它有几个选票,尽管基于克里斯蒂娜(Christina)的其他问题,我认为这不是一个可行的答案她的原因是,由于目前使用这种语言模型格式的iOS应用程序内识别系统,使用50,000个单词的 ..
发布时间:2020-06-29 19:26:10 其他开发

任何人都有Sphinx语音识别的经验吗?

有人使用 Sphinx 语音识别堆栈来构建IVR应用程序吗?我正在寻找开放源代码的替代品,以替代MSFT和其他公司的昂贵且有些限制的选择.我无法找到将开源语音/语音应用程序联系在一起的综合软件包. 解决方案 最后我看了狮身人面像,它的8khz音频有问题,导致 表现真的很差很少有人在谈论 在实际环境中成功部署了Sphinx,但您可能会 能够使其开创性地工作.看到这里 更多信息: 最接近 ..
发布时间:2020-06-26 20:20:07 其他开发

使用Sphinx 4进行mp3识别

我们可以在不使用wav文件的情况下将mp3文件用于语音识别过程吗?还是我们可以从mp3生成wav文件,然后进行语音识别,而不会严重影响准确性?问题是我需要在应用程序中最小化通过网络传输的负载.转换中丢失的信息会成为准确性的重要因素吗? 解决方案 我们可以在不使用mp3文件的情况下进行语音识别吗? WAV文件? 不直接.为了能够识别mp3流,您需要使用java库来读取mp3并将其转 ..
发布时间:2020-05-12 19:35:54 其他开发

使用语音进行性别识别的开源工具

晚上好, 我正在与Kinect合作进行一个项目,我需要使用传感器麦克风捕获的语音信息进行性别识别. 识别也可以是基于基于文本的,即用户说的句子可能始终是相同的.我“只是"需要男性/女性的二进制答案. 我已经检查了非常流行的开源Sphinx,但是我不知道它是否可以满足我的需求. 对我可以使用的东西有任何想法吗? 预先感谢. 解决方案 出于完整性考虑,我最终在不分析语音输入的情况 ..
发布时间:2020-04-26 09:50:24 其他开发

如何使用sphinx从JSGF语法中检索标签?

我用Java编写了一个应用程序,它使用CloudGarden API来解析JSAPI语法,从语法规则中返回标记,然后相应地处理这些标记。 CloudGarden API的问题在于它依赖于Windows。我需要一个可以执行相同任务的跨平台库。我不需要语音合成,也不需要语音识别。本质上,一个字符串被传递给包含一些转录语音的程序。我需要根据我的语法文件解析这个字符串,以检索动作标记(JSGF语法规则中{ ..
发布时间:2019-01-08 18:45:37 Java开发

我可以在桌面应用程序中使用谷歌语音识别API

我想知道我是否可以使用谷歌的语音识别api作为我的桌面应用程序。我已经看到一些例子,我必须将语音转换为文件并发送到网址。但这将是一项繁琐的任务,因为在我的应用程序中,用户必须不断提交他的声音。那么有没有其他替代方法使用谷歌语音API。我最不感兴趣的是使用狮身人面像,因为它的准确性非常低,我不知道如何在字典中添加新单词而不将其添加到字典中它不会识别新单词。任何帮助将不胜感激。 解决方案 你指 ..
发布时间:2018-12-28 16:07:44 Java开发

用于在音频文件中转录语音的开源软件

有人可以推荐可靠的开源软件来转录wav文件中的英文语音吗?我研究过的两个主要程序是 Sphinx 和朱利叶斯,但我从来没有能够工作,每个转录文件的文档都是粗略的。 我正在开发64位Ubuntu 10.04,其回购包括sphinx2和julius,以及voxforge的julius英语声学模式。我专注于转录文件,而不是直接处理来自麦克风的声音,因为我已经放弃了期望像这样的项目与Ubuntu的音 ..
发布时间:2018-12-25 22:22:23 Java开发

使用Sphinx4进行关键字或关键短语识别

我正在尝试使我的java代码(使用eclipse)执行某些功能,如果说某件事。我正在使用Sphinx4库,这就是我现在所拥有的: 我希望它能做的是: IF(TRUE)someFunction(); 如果我的演讲是Hello Computer,Hello Jarvis,Good Morning Computer或Good,则运行该函数早上贾维斯。或者换句话说,如果语音 ..
发布时间:2018-12-20 00:05:28 Java开发

Beaglebone:gcc在尝试使用'make'构建时包含路径错误

我试图在我的beaglebone黑色上构建用于语音识别的cmu pocketsphinx。我已经下载了sphinxbase的源代码并运行了./configure。现在,当我运行'make'时,出现以下错误: 在src中创建所有 make [1] :进入目录`/home/root/Pocketsphinx/sphinxbase-0.8/src' 在libsphinxbase中创建所有文件 ..
发布时间:2018-04-21 11:22:16 其他开发

处理PocketSphinx Android应用程序中的错误

我正在使用pocketphinx演示程序附带的默认字典,这对我的目的很有用。当用户输入短语时,该应用程序将启动一个关键字监听,但是如果字典中没有找到该字词,则该应用程序将崩溃。应用程序在服务中崩溃onError()。如何处理错误?有什么办法可以抓住错误吗?总的来说,我希望服务在发生错误时调用stopSelf(),因此主要活动也不会崩溃。 错误: 错误:“kws_search.c”,第1 ..

为什么PocketSphinx Android演示需要cygwin

我正在尝试在Android中开发一个语音识别程序,到目前为止,我已经看到,最受欢迎的选项似乎是CMU狮身人面像,用pocketphinx用于Android。从我所理解的CMU的源代码Sphinx已经在Java中提供了在计算机上运行,​​所以不会直接在Android手机上运行。所以我将首先将CMu sphinx代码编译成一个库(像创建一个dll的代码,如果我在C中工作,我需要共享的代码),然后在an ..
发布时间:2017-07-28 18:33:05 Java开发