speech-recognition相关内容

参数必须是1个整数的元组。接收的OR TypeError:int()参数必须是字符串、类似字节的对象或数字,而不是列表

我尝试使用FIT_GENERATOR和TALOS(用于超参数调优)。早些时候,当我使用FIT方法时,我得到了内存错误,所以当我在这里搜索时,人们说我应该尝试使用FIT_GENERATOR。前面我给了太多的参数,所以即使使用FIT_GENERATOR,我也得到了内存错误,现在我减少了参数的数量,现在我得到了不同的错误。请查找下面的代码和错误。 代码: def yield_arrays_t ..

单个单词的语音到文本转换

我想创建一个自动语音识别系统,它将从数据库中的单词列表中识别出正确的单词。我已经看到CMUSphinx可以用来解决这个问题。我试过Hello world狮身人面像演示应用程序,但它没有达到预期的效果。 我不知道如何选择正确的声学模型、词典文件、语言模型。对于单个单词,是否需要语言模型? 是否有针对印度英语的预置声学模型? 推荐答案 我试过Hello world狮身人面像演示 ..
发布时间:2022-04-02 09:52:29 其他开发

使用SAPI的语音识别:通过音素支持定制语言

我有一篇已从文本转录为音素的文本。 我现在要修改或创建自定义语法XML,它将定义具有国际音素的单词的发音,并使用具有要识别的特定拼写的该语法,而不是任何其他拼写。 我要为使用英语/德语等不同语言的某些单词添加语音识别; 使用SAPI可以做到这一点吗?如何做到?谁能给我指个正确的方向(使用SpInProcRecoConext.Recognizer和自定义语法) 所以我想使用已 ..
发布时间:2022-04-02 09:51:16 其他开发

Android SpeechRecognizer设置识别引擎?

我正在使用SpeechRecognizer将语音转换为文本。我正在使用三星,在我将语音识别器设置为‘Samsung Powered by Vlingo’时遇到错误,在我更改为‘Google’后,错误消失了。我想知道有什么方法可以编程更改识别引擎吗?谢谢。 推荐答案 我找到了问题的答案。我可以使用‘Public Static SpeechRecognizer createSpeechRe ..
发布时间:2022-04-02 09:50:06 Java开发

Microsoft语音识别定制培训

我一直想创建一个使用Microsoft语音识别的应用程序。 我的应用程序的用户应该经常说缩写的东西,比如‘LHC’代表‘大型强子对撞机’或‘CERN’。根据该顺序,我的应用程序将返回 你说:在C岁的时候 您说:CERN 虽然它对‘CERN’有效,但对‘LHC’却失败得很厉害。 然而,如果我可以制作自己的定制培训文件,我就可以很容易地在其中的某个地方放置术语LHC。然后,我 ..
发布时间:2022-04-02 09:46:08 Python

如何使用Python模块蜻蜓识别语音?

我一直在试图弄清楚如何使用蜻蜓模块。我已经看了文档,但我似乎不知道如何使用它。我只希望能够识别几个短语,并根据这些短语采取行动。 推荐答案 正确,此示例将终止。我已经见过这个特定的例子很多,但它缺少许多关键功能。 第一件事是不导入pythoncom。这为程序提供了一个主循环。上述 from dragonfly.all import Grammar, CompoundRule ..
发布时间:2022-04-02 09:44:44 Python

隐马尔可夫模型(HMM)中的三态电话模型

我想问一下HMM中三态手机模型的含义。本案例是基于隐马尔可夫模型在语音识别系统中的应用。因此,这个例子是基于隐马尔可夫模型对语音进行声学建模的。 我从一篇期刊论文中获得了这个示例图片: http://www.intechopen.com/source/html/41188/media/image8_w.jpg 图1:3-声音的状态HMM/s/ 所以,我的问题是: 3个状态是 ..

Android、WebView和SpeechRecognition-API

我面临着一个相当恼人的问题: 对于客户项目,我需要使用HTML5/JavaScript(客户规范)进行某种“语音结束”检测。所以我做了一些研究,想“好吧,让我们试试SpeechRecognition API”,它是“onSpeech End”-事件。这在我的机器上就像咒语一样工作,但在应用程序本身却不起作用。在我的研究中,我发现,您在应用程序中使用的WebView实际上不是系统的默认浏览器。 ..

如何在Android语音识别中增加认为输入完成的时间?

在Android语音识别中,有谁知道如何增加在我们停止听到语音后认为输入可能完成所需的时间。在语音识别过程中,我需要防止端点指针在很短的中途停顿期间被切断。如果有谁知道解决方案,请给我回复。如有任何回复,我们将不胜感激。 提前谢谢 推荐答案 这两个参数相关,它们控制识别器在停止之前需要听到的静音量。 额外输入完成静音长度毫秒 或 EXTRA_SPEECH_INPUT_POSSI ..
发布时间:2022-04-02 09:38:02 移动开发

Microsoft语音识别速度

我正在开发一个使用微软语音识别器的小练习应用程序。对于我正在做的事情,我似乎无法让它足够快地识别单个单词。我希望能够正常说话,系统会从我说的话中抓取“关键字”,并产生一个字符串。目前,我使用的是5个单词的自定义语法。红色、蓝色、黄色、绿色、橙色。例如,如果我说红色、蓝色、黄色。引擎会抓住“红色”,其余的进入空隙。 我已尝试使用以下选项: sr.RecognizeAsync(Recogn ..
发布时间:2022-04-02 09:35:11 C#/.NET

如何在Python中使用语音识别来检测一个单词

我知道如何使用Python检测语音,但这个问题更具体: 如何使Python只侦听一个单词,然后在Python可以识别该单词的情况下返回True。 我知道,我可以让Python一直在监听,然后做一些类似的事情 伪码: while True: if stt.listen() == "keyword": return True 我已经这样做了,程序在始终收听了几分 ..
发布时间:2022-04-02 09:30:27 Python

如何将Mozilla DeepSpeech实现到PHP Web应用程序中将语音转换为文本?

我有一个PHP Web应用程序,正在寻找一个开源的,高精度的语音到文本识别实现,将接受语音命令打开用户的网页。例如:“进行销售”(这将打开Create Sales PHP页面)、“进行采购订单”、“打开日终报告”等。 我的问题: 我想知道是否可以使用Mozilla DeepSpeech从Firefox浏览器获取.wav音频并将语音转换为文本。如果是,使用麦克风录制Firefox语音并使 ..

用于语音检测和识别的开源代码

我有15盘录音带,我相信其中一盘包含了我和祖母交谈的旧录音。快速地试图找到合适的地方,但没有找到。我不想听20个小时的磁带才能找到它。位置可能不在其中一盘磁带的开头。大多数内容似乎分为三类--按照总长度的顺序,最长的是:静音、语音广播和音乐。 我计划将所有磁带转换为数字格式,然后再次查找录音。最明显的方法是在我做其他事情的时候在背景中播放它们。这对我来说太直截了当了,所以:有没有什么开源库或 ..
发布时间:2022-04-02 09:25:49 其他开发

为什么在此语音识别代码中缺少4-1-1.Match文件?

我在语音识别的解码部分遇到问题。我按照here的步骤操作。当我键入:perl scripts_pl/decode/slave.pl时,我得到以下错误: 模块:使用先前训练的模型进行解码 对从0开始的130个数据段(第1部分,共1个)的解码找不到/home/go/Documents/tutorial/an4/bin/sphinx3_decode的可执行文件 在… /home/go/Docume ..
发布时间:2022-04-02 09:24:16 其他开发

使用PYAudio库将Django应用程序部署到Heroku

我构建了一个用于语音识别的Django应用程序,该应用程序使用用户的麦克风录制音频,然后将其转换为文本。它在本地运行得很好,但当我尝试在Heroku中部署它时,它给出了一个错误,即Pydio无法安装和 命令“GCC”失败,退出状态为%1。 我使用的是Python3.6和Windows 7。如何将此应用程序部署到Heroku? 推荐答案 该应用程序使用用户的麦克风录制音频,然后将其 ..
发布时间:2022-04-02 09:22:55 其他开发

C#Syst.Speech.识别替换字词

我目前正在使用Microsoft.Speech API将话语口述为文本,但我真正需要的是该程序可以使用的其他口述。我用这个作为我的荣誉论文,因此我希望知道对任何话语的前十种解读。 2011年,人们提出了一个非常类似的问题,如果不是很准确的话: C# system.speech.recognition alternates 但一直没有人接电话。因此,我的问题是:如何使用Microsoft.S ..
发布时间:2022-04-02 09:15:45 C#/.NET

按键时停止语音识别

我可以停止在按键盘时收听音频吗? 我尝试这样更改记录函数(在init.py中): def record(self, source, duration=None, offset=None): """ Records up to ``duration`` seconds of audio from ``source`` (an ``AudioSource` ..
发布时间:2022-04-02 09:14:38 Python

当我在Python中使用语音识别时,我可以控制开始和结束时间吗?

我进行了如下编码。不过,我想知道有没有办法控制录制时长。事实上,我想有一个程序,其中有一个开始和完成按钮,这样我就可以控制录制。我知道这是一个基本的问题。但我真的需要解决这个问题。帮帮我~我应该如何补偿这个问题? import speech_recognition as sr r = sr.Recognizer() mic = sr.Microphone() show = input(" ..
发布时间:2022-04-02 09:13:27 Python