speech-recognition相关内容

持续识别Android上的所有内容?

我正在做一个项目,涉及Android上的语音识别。我有一些问题在这个网站上没有明确的答案(或者实际上是任何问题)。我需要做一些类似于演讲到文本的事情,问题是我需要它连续工作,想象一个应用程序在后台运行,并将它在txt上听到的一切写下来。我知道我需要纠正很多“噪音听力”,但它会在稍后出现。 我正在使用PocketShinx-Android,并尝试遵循以下教程: http://cmusphinx ..
发布时间:2022-04-02 10:33:38 移动开发

基于有限状态文法的CMU Sphinx声学模型训练

我需要训练我自己的声学模型。在官方维基上,这个过程是以DMP格式为ngram模型描述的,但我需要使用以JSGF格式提供的(语法)语言模型。有这样的可能性吗?如果是这样的话,你能提供一个关于这个主题的教程吗? 推荐答案 修改最小。在安装位置或脚本中打开psdecde.pl脚本并更改 -lm => $ST::DEC_CFG_LANGUAGEMODEL, 至 -jsgf => ..
发布时间:2022-04-02 10:31:34 其他开发

Pocket中的段时间戳狮身人面像

我正在尝试使用PocketShinx提取每个段的开始和结束时间戳。下面的代码用于提取单词Token。如何访问时间戳? 我已尝试查看此处的文档http://cmusphinx.sourceforge.net/doc/pocketsphinx/index.html,但找不到方法 #!/usr/bin/env python import os import sphinxbase as sb ..
发布时间:2022-04-02 10:29:55 其他开发

如何在c#项目中添加自定义词典

我正在开发一个基于语音识别的C#项目。我想识别印度英语口音中的单词,因此我想了想词库,然后在该文件中添加发音,但我不知道如何在我的项目中添加词典&;如何创建词典? 推荐答案 Lexicons不能通过System.Speech.Recognition公开,很遗憾。不过,您可以使用SAPI的SpeechLib自动化接口访问词典;您要创建的对象是SpLexicon。 请注意,Sy ..
发布时间:2022-04-02 10:28:12 C#/.NET

在给定大量单词的情况下,如何有效地创建用于语音识别的语法文件?

只用50个单词就可以轻松编写语音识别语法文件,因为您只需手动完成即可。如果您有10,000或100,000个单词,最简单、最有效的方法是什么? 示例: 比方说我们有“RC可乐”和“百事可乐”。我们将拥有包含2条规则的语法文件: 饮料:(可乐?[可乐苏打水]) COLANAME:[RC Pepsi] 它将识别“RC”、“RC Coke”、“RC Cola”、“RC Soda”、“Pep ..
发布时间:2022-04-02 10:26:24 其他开发

HTC One M7上的语音识别器

我使用Android内置的语音识别类编写了一个语音识别应用程序。在使用createSpeechRecognizer(Context)函数获取的语音识别器对象上调用startListning函数时,在我的开发人员控制台中显示以下异常。 安全异常: java.lang.SecurityException: Not allowed to bind to service Intent { ..
发布时间:2022-04-02 10:23:30 Java开发

语音识别和声音与音乐的比较

我正在尝试制作一款具有语音识别功能的Android应用程序,但不幸的是,Google不支持我的语言(马其顿语),我正在尝试比较两种录音的声音。 我正在使用http://code.google.com/p/musicg/来记录和比较语音,我正在堆叠初始化语音检测的设置。有人可以告诉我如何重写语音检测的初始化函数,这对我来说非常重要。或者其他一些想法 如何做到这一点。 这是哨声检测的初始化 ..
发布时间:2022-04-02 10:19:48 移动开发

NIST球体格式文件

为了读取NIST SPHERE格式文件,我正在尝试安装从here下载的NIST SPHERE软件,但遇到一些错误: make[2]: Entering directory `/home/ibtissem/tools/nist/src/bin' gcc -I/home/ibtissem/tools/nist/include -L/home/ibtissem/tools/nist/lib -g ..
发布时间:2022-04-02 10:18:03 其他开发

带唤醒功能的Google Python语音识别

我在一台覆盆子PI上使用了Google Python语音识别,它工作得真的很好。然而,它一直在倾听,我更喜欢有一个唤醒词,这样它就只在我需要的时候才倾听。 此时,它会监听,直到出现静音(或返回到任何环境背景噪音),然后将声音片段发送到API以进行语音到文本识别。我有没有办法缩短它在监听的时间?这样,它可以一次只听一个单词,并等待我设置的任何唤醒单词。 推荐答案 最好是离线实现唤醒 ..
发布时间:2022-04-02 10:15:46 Python

我想在我的应用程序中集成连续(免提)语音命令识别功能,以实现家庭自动化

我已经创建了一个简单的Android应用程序,用于控制连接到我的树莓PI的继电器。我已经使用按钮和基本的语音识别来触发这些按钮,并打开/关闭相应的中继频道。 从现在起,语音识别部分是由RecognizerIntent处理的,我需要按应用程序上的一个按钮来打开谷歌语音提示,它会监听我的语音命令,并激活/停用控制继电器开关的相应按钮。 我想用连续语音识别来做同样的事情,它允许应用程序连续收 ..

C#返回语音拼音而不识别它

我正在尝试制作一个波斯语语音的类似人类的词典(Db),所以我试图说话,并让c#按语音产生它,但问题是我找不到任何事件来找到我说的话。例如,我们有SpeechRecognized事件,但它在识别语音后触发。以下是我的代码示例: SpeechRecognizer rec = new SpeechRecognizer(); public Form1(){ ..
发布时间:2022-04-02 10:09:10 C#/.NET

如何在语音识别器中隐藏您的音频将被发送到Google以提供语音识别服务?

我正在使用Google语音识别器在Android中集成语音服务,但同时按下麦克风按钮,显示了这条恼人的祝酒词。请给我建议一个隐藏这一点的方法。 谢谢 推荐答案 如果您的设备已植根,您可以隐藏通知,但不能阻止将音频发送到谷歌。 安装已转换的框架和模块UnToaster已转换,然后添加: Com.google.android.Google快速搜索框 ..
发布时间:2022-04-02 10:06:41 移动开发

部分语音识别

我目前正在使用微软的语音引擎进行语音识别。 它在C#中的设置和使用非常简单,并且允许使用比我最初想象的更少的代码行来实现伟大的目标。 现在的问题是,我真的不知道该如何处理: 我知道,引擎需要开始监听,然后你说一个词或一个句子,它会在词典中进行比较,看看是否能找到匹配。如果是这样,程序将执行您希望它执行的任何操作。 让我摸不着头脑的是,我想让引擎“检测”他的词典中的单词,在包含一个或所有这些 ..
发布时间:2022-04-02 10:04:26 C#/.NET

带标点符号的实时语音识别

使用自动标点实现语音识别(语音到文本)的方法是什么?我想使用它将演讲(45分钟的演讲)转换为文本,并在可能的情况下动态更新视图。 我尝试了SpeechRecognizer,但它只给我没有标点符号的单词,并且在第一个单词之后停止收听。 推荐答案 您可以使用Punctuator,它在深度神经网络的帮助下为ASR结果指定标点符号。 ..
发布时间:2022-04-02 10:03:24 移动开发

巨蟒语音比较

我有两个.wav文件,我需要比较它们并确定它们是否包含相同的单词(顺序也相同)。 我一直在寻找最好的方法。我想不出如何让pySpeech使用文件作为输入。我试过让CMU的狮身人面像项目工作,但我似乎不能让GStreamer与Python27一起工作,更不用说他们的项目了。我也玩过蜻蜓,但没有运气。 我使用的是64位Win7和Python27。有谁有什么主意吗? 非常感谢您的帮助。 ..
发布时间:2022-04-02 10:01:20 Python

Android上的关键字激活语音识别

是否可以在您自己的应用程序中使用“Google Now”这一很酷的语音激活功能? 因此,我想要的是用户不必通过按下按钮或某事来触发激活。就像这样。 我更希望通过关键字激活自动语音识别。 例如:当打开“Google Now”时,你只需说:“Google”。在该命令之后,系统将侦听实际输入。 使用Android API可以吗?或者是否有提供此行为的开源库? 我知道“张开耳朵”可以做 ..
发布时间:2022-04-02 09:58:56 移动开发

从Google Speech API结果中检测流畅度

我正在尝试使用Google Speech(转换为文本)API确定演讲者的流利度。 到目前为止,我发现接口(Betav1)可以显示说出一个单词的时间(开始时间和结束时间)。 和来自维基百科的 口语流利度或口语流利度都是衡量产出的标准 和接受演讲,作为一个流利的演讲者必须能够 在谈话中理解并回应他人。口语是 典型地以看似不流利的品质为特征(例如, 支离破碎、停顿、错误开始、犹豫、重复 ..
发布时间:2022-04-02 09:57:16 其他开发