speech-recognition - IT屋-程序员软件开发技术分享社区

安卓，柯特林。由于某些原因，SpeechRecognizer无法正常工作

我正在使用名为SpeechRecognizer的Android Speech API，试图将语音转换为文本，但由于某种原因，我一点击按钮，就看到消息&cot；Can‘t to to Google Now"；，并且窗口关闭，没有等待我的演讲。或者声音断断续续，什么也不会发生。 class MainActivity : AppCompatActivity() { var voic ..

发布时间：2022-08-09 12:13:42 android kotlin speech-recognition 移动开发

Safari语音识别

我已设置语音识别(语音到文本) http://yjwebsoft.com/voice/ 出于某种原因，它可以在Chrome上运行，但不能在Safari上运行。但在教程中，它表示它确实支持Safari 推荐答案语音识别是纯Chrome功能，不支持Safari。您可以在此处找到最近的状态： http://caniuse.com/#feat=speech-recognition ..

发布时间：2022-08-09 12:04:17 speech-recognition webspeech-api 其他开发

在librosa MFCC功能中使用了多少个MEL滤镜？

librosa.Feature.mfcc(y=NONE，sr=22050，S=NONE，n_mfcc=20，dct_type=2，Norm=‘Ortho’，Lifter=0，**kwargs) librosa MFCC函数不包含要为要使用的MEL滤镜数量传递的参数。有没有办法定义它，或者它是否使用librosa.filters.mel中使用的默认值‘’n_mes=128‘’。推荐答案 ..

发布时间：2022-08-09 11:52:45 speech-recognition librosa mfcc 其他开发

Python-语音识别：属性错误：ENTER

我正在尝试使用语音识别和pyttsx3模块在python中编写Jarvis代码。我因为Attribute error:__enter__的错误而卡住了我不明白为什么会出现这样的情况。我对蟒蛇还是个新手。我目前使用的是python3.8。 def takeCommmand(): r = sr.Recognizer() with sr.Microphone as source: ..

发布时间：2022-07-17 22:10:40 python speech-recognition text-to-speech Python

将原始PCM数据转换为RIFF波

我正在尝试将原始音频数据从一种格式转换为另一种格式，以便进行语音识别。从Discord服务器以20ms块的格式接收音频：48Khz, 16-bit stereo signed BigEndian PCM。我使用CMU's Sphinx进行语音识别，它将音频作为RIFF (little-endian) WAVE audio, 16-bit, mono 16,000Hz中的InputStr ..

发布时间：2022-07-04 14:29:09 java audio binary speech-recognition Java开发

语音识别：Jack服务器未运行

我正在使用Speech Recognitionpython库设置声音识别器。这是我到目前为止的代码： #!/usr/bin/env python3 import speech_recognition as sr r = sr.Recognizer('es-MX') with sr.Microphone() as mic: audio = r.listen(mic) p ..

发布时间：2022-07-04 14:22:44 linux speech-recognition python-3.4 服务器开发

是否可以从一个帐户同时执行两个语音到文本流？

所以，问题就在标题上，我可以为一个用户创建语音到文本流，效果很好，但当我尝试连接第二个用户时，它对所有人都不好，有时对一个用户很好，所以问题是，我是否可以使用一个Google_APPLICATION_Credentials同时为两个或更多用户创建Sppech到文本流，或者每个用户都需要启动自己的项目？推荐答案您应该能够使用相同的StreamingRecognize()客户端创建多个 ..

发布时间：2022-04-03 12:45:39 speech-recognition grpc speech-to-text google-cloud-speech google-speech-to-text-api 其他开发

在系统中识别数字时出现问题。语音？

Speech和我添加了Grmmar，它只检测这样的数字 SpeechRecognitionEngine RecognitionEngine = new SpeechRecognitionEngine(new CultureInfo("en-US", true)); // Created Grammar For only Numbers 1 t ..

发布时间：2022-04-02 11:09:15 c# speech-recognition sapi C#/.NET

移动设备上的本地语音命令识别

我需要在Android和iPhone应用程序中实现语音命令识别，而不使用互联网通信-所有这些都必须在设备上进行本地处理，并且必须能够识别20-50个命令。换句话说：在Android和iOS上运行的本地有限词汇量的说话人独立语音识别。使用谷歌并没有给我足够的启发，所以我希望有过这方面工作经验的人给我一些建议。有什么建议吗？推荐答案您可以使用CMUSphinx。 ..

发布时间：2022-04-02 11:06:40 android ios speech-recognition 移动开发

错误"；找不到PyAudio；检查Windows上的安装

我有一段简单的代码，可以识别我的声音并将其转换为文本。我正在使用语音识别。但我收到错误“找不到PyAudio；请检查安装”。如何修复？以下是我的代码： import speech_recognition as sr r = sr.Recognizer() with sr.Microphone() as source: print('Speak anything') ..

发布时间：2022-04-02 11:03:43 python speech-recognition Python

语音识别引擎识别器

我刚刚下载了fr-FR运行时语言包，以便可以通过我的程序识别法语语音。但是，我的程序抛出错误其他信息：找不到所需ID的识别器。在 SpeechRecognitionEngine recognizer = new SpeechRecognitionEngine(new System.Globalization.CultureInfo("fr-FR")); ..

发布时间：2022-04-02 10:59:36 c# speech-recognition sapi C#/.NET

如何通过pySpeech或蜻蜓输入和处理音频文件以转换为文本

我看过pySpeech和蜻蜓的文档，但不知道如何输入音频文件转换成文本。我试过用麦克风对它说话，语音被转换成文本，但如果我想输入以前录制的音频文件。有人能帮我举个例子吗？推荐答案 import speech_recognition as sr print(sr.__version__) r = sr.Recognizer() audio_file = sr.AudioFile('aud ..

发布时间：2022-04-02 10:56:50 python speech-recognition Python

CMU Sphinx4音素听写

如何将sphinx4配置为只能检测听写中的音素？我已经阅读了partial results “您可以通过在解码器中设置配置变量‘FeatureBlockSize’来控制触发结果侦听器的频率。” 但我的问题是总是需要一个语法，如HelloWorld示例中的hello.gram。我需要能够从连续的语音中检测和识别音素。推荐答案以下是斯芬克斯对此的看法： Pho ..

发布时间：2022-04-02 10:54:31 java speech-recognition cmusphinx jsapi phoneme Java开发

打字文本中的语音识别与语音合成

我通过如下所示创建界面，在打字脚本中运行SpeechRecognition，运行正常： namespace CORE{ export interface IWindow extends Window{ webkitSpeechRecognition: any; } } 我尝试使用同样的方法来处理SpeechSynsing，但FIELD，并且以下代码不起作用 ..

发布时间：2022-04-02 10:52:37 typescript speech-recognition speech-synthesis 其他开发

通过附加上下文改进Android语音识别

据我所知，Android API使用谷歌语音识别服务将语音转换为文本。我已经学习了API，我发现它很简单，只需将语音转换为单词数组。有没有什么方法可以提高识别率，我是说，如果我知道上下文，我可以给服务发送一些参数来提高识别率吗？或者，是否有任何其他语音识别服务可用于此目的？提前谢谢。推荐答案有什么方法可以提高识别率吗？我的意思是，如果我知道上下文，我可以给服 ..

发布时间：2022-04-02 10:49:45 android speech-recognition speech-to-text 移动开发

C#系统.Speech NotFound！

我正在尝试使用与此相关的语音识别： C# Speech Recognition - Is this what the user said? 可系统找不到其程序集。推荐答案确保have a reference在您的项目中使用System.Speech.Recognition。此外，此功能仅在.NET 3.0及更高版本上可用。 ..

发布时间：2022-04-02 10:47:01 c# speech-recognition C#/.NET

我正在使用Google API进行语音识别，但希望限制收听时间。例如两秒。两秒钟后，即使用户继续说话，识别器也应该停止收听。我尝试了一些额外功能，如 EXTRA_SPEECH_INPUT_COMPLETE_SILENCE_LENGTH_MILLIS EXTRA_SPEECH_INPUT_MINIMUM_LENGTH_MILLIS EXTRA_SPEECH_INPUT_POSSIBLY_COM ..

发布时间：2022-04-02 10:44:15 android speech-recognition recognizer-intent 移动开发

检测已安装的语言以进行脱机识别

可以通过代码确定设备上当前安装了哪些语言包？已尝试： Intent detailsIntent = new Intent(RecognizerIntent.ACTION_GET_LANGUAGE_DETAILS); sendOrderedBroadcast(detailsIntent, null, new LanguageDetailsChecker(), null, Ac ..

发布时间：2022-04-02 10:42:34 android speech-recognition 移动开发

INVALID_ARGUMENT：请求负载大小超过限制：10485760字节

我第一次在一个项目中使用GCS Speech API将一系列音频文件转换为文本。每个文件大约有60分钟，在整个时间里都是一个人不停地说话。我已经安装了GC SDK，正在使用它执行请求，如下所示： gcloud ml speech recognize-long-running "/path/to/file/audio.flac" --language-code="pt-PT" --asy ..

发布时间：2022-04-02 10:41:24 speech-recognition speech-to-text google-speech-api 其他开发

在iOS中将语音转换为文本

我正在寻找一个实现Open Ear或任何其他语音识别器将语音转换为文本的示例示例。有没有什么教程可以帮我把文本转换成语音。推荐答案有几个用于语音到文本转换的库。您可以使用其中的任何一个。如下： openears这是最适合此用途的库。 libsprec 它使用Google语音识别API，因此支持多种语言。 VocalKit，使用高质量的开源PocketSph ..

发布时间：2022-04-02 10:39:24 ios speech-recognition 移动开发

speech-recognition相关内容