speech-to-text相关内容

以编程方式在android中的软输入键盘上禁用语音到文本按钮(麦克风)

提前感谢您的帮助. 我正在开发一个用于研究目的的 android 应用程序,并且需要禁用软输入键盘上的语音转文本按钮.其原因是由于我正在开发的应用程序使用麦克风而出现的并发问题.我知道对于一般应用程序,禁用键通常被认为是不可能的(因为用户可能会更改默认键盘).我知道将使用默认键盘. 考虑到这一点,是否可以禁用某些键?我相信至少我应该能够指定输入类型,以便隐藏麦克风按钮.我这样说是因为如 ..
发布时间:2022-01-13 23:05:42 移动开发

谷歌语音到 C# 中的文本 API

当flac文件使用windows的录音机录制手册并使用软件转换器进行转换时,我的程序从谷歌得到了正确的响应. 但是当我使用我的程序记录的文件时,我得到了 "{"result":[]}“来自谷歌.我该怎么办?这是我的代码: 发件人: private static void CopyStream(FileStream fileStream, Stream requestStream){va ..
发布时间:2022-01-01 20:02:47 C#/.NET

从自己的声音文件语音到文本

您可能知道,使用 Android API 实现语音转文本非常简单.您所要做的就是调用 API 的意图,它会为您返回文本.我的情况有点不同,我有一个预先录制的 3GPP 声音文件,我从用户那里录制并保存在 SD 卡上.我想知道是否可以像任何其他语音识别一样将其转录成文本.语音转文本 API 是否允许上传您自己的声音文件进行处理?或者这是不可能的? 解决方案 API 不允许,但请参阅 这篇博文 ..
发布时间:2021-12-20 23:30:58 移动开发

Google-speech-api 错误地转录语音数字

我开始使用谷歌语音 api 转录音频. 正在转录的音频包含许多一个接一个说出的数字. 例如273 298 但转录返回 270-3298 我的猜测是它会将其解释为某种电话号码. 我想要的是未解析的输出,例如“2 73 2 98",我可以自己处理和解析. 有没有设置或者支持这种东西? 谢谢 解决方案 所以我遇到了完全相同的问题,我认为我们找到了解决方案 ..

如何检测谷歌云平台机器学习语音api中所说的语言

是否可以选择使用 Google Cloud Platform Machine Learning 的 Speech API 自动检测口语? https://cloud.google.com/speech/docs/languages 表示支持的语言列表和用户需要手动设置此参数以执行语音到文本. 谢谢马赫什 解决方案 从上个月开始,Google 在其语音转文本 API 中添加了对口 ..

PyAudio 打印 ALSA 警告并且不起作用

我正在尝试将基本的 Python 语音转换为文本代码.这是代码. 将speech_recognition导入为srr = sr.Recognizer()以 sr.Microphone() 作为来源:音频 = r.listen(source)尝试:打印(“你说"+ r.recognize(音频))除了查找错误:打印(“无法理解音频") 代码运行良好,直到到达打印阶段,然后抛出此错误.是不是我做错 ..
发布时间:2021-11-27 08:31:55 服务器开发

这是什么错误-“IOError:[Errno 2] 没有这样的文件或目录:'audio.flac'",我正在尝试使用 google 语音识别 api for python

基本上我想将语音转换为文本,所以我尝试使用 google 语音识别 api for python. 这是我要运行的代码- from pygsr import Pygsr语音 = Pygsr()Speech.record(3) # 以秒为单位的持续时间 (3)短语,complete_response = Speech.speech_to_text('es_ES')打印短语#这是所需的输出 ..

这是什么错误-“IOError:[Errno 2] 没有这样的文件或目录:'audio.flac'",我正在尝试使用 google 语音识别 api for python

基本上我想将语音转换为文本,所以我尝试使用 google 语音识别 api for python. 这是我要运行的代码- from pygsr import Pygsr语音 = Pygsr()Speech.record(3) # 以秒为单位的持续时间 (3)短语,complete_response = Speech.speech_to_text('es_ES')打印短语#这是所需的输出 ..
发布时间:2021-11-24 23:01:55 C#

Android:阿拉伯语语音识别 - 离线

任何人都可以帮助我或给我有关阿拉伯语语音识别的线索 - 适用于 android 的离线功能吗? 我想开发一个简单的应用程序来进行语音识别 - 离线做这个在线我知道如何......如果有人有建议或链接到一个开源项目甚至图书馆来购买,那么高效地做到这一点将是惊人的. 提前致谢. 解决方案 使用 intent.putExtra(RecognizerIntent.EXTRA_LANG ..

通过 API 进行语音到文本对话

任何人都可以建议免费(非常好)或付费的 API 以将语音转换为 iPhone 应用程序的文本. 谢谢,雅利安 解决方案 有一次我打算尝试将这个库移植到 iPhone: http://www.speech.cs.cmu.edu/sphinx/tutorial.html 它能够构建您自己的语音词典. ..
发布时间:2021-11-15 04:05:15 移动开发

Watson Speech to Text 响应时间

在推送到 Bluemix 时遇到一些服务问题 我通过 php-curl 发送的推送请求是: POST https://stream.watsonplatform.net/speech-to-text/api/v1/recognize 带有以下参数 型号:en-US_NarrowbandModel 内容类型:音频/wav;费率:8000 传输编码:分块 时间戳:真 w ..
发布时间:2021-11-15 01:39:00 其他开发

听写(语音识别)文本与 Swift 中的字符串不匹配

我开发了一个语音识别功能,可以检测阿拉伯语音频并返回一个字符串,我将它分配给一个名为speechRecogText的变量. 在代码中,我还有一个文本字段,我将输入存储在另一个名为 textFieldText 的字符串变量中. 目标我希望能够检查 speechRecogText 是否包含 textFieldText 中的需求,这通常适用于英语,但适用于阿拉伯语不起作用. 但是,当我 ..
发布时间:2021-09-30 20:14:16 移动开发

SAPI 和 Windows 7 问题

我正在尝试使用 Windows 7 识别语音,但它总是将语音识别为命令或只是说“那是什么?". 我如何获得所有演讲? 代码: SpeechRecognizer _speechRecognizer;公共窗口 1(){初始化组件();//设置识别器_speechRecognizer = new SpeechRecognizer();_speechRecognizer.Enabled = ..
发布时间:2021-09-26 18:40:18 其他开发