speech-recognition相关内容

听写(语音识别)文本与 Swift 中的字符串不匹配

我开发了一个语音识别功能,可以检测阿拉伯语音频并返回一个字符串,我将它分配给一个名为speechRecogText的变量. 在代码中,我还有一个文本字段,我将输入存储在另一个名为 textFieldText 的字符串变量中. 目标我希望能够检查 speechRecogText 是否包含 textFieldText 中的需求,这通常适用于英语,但适用于阿拉伯语不起作用. 但是,当我 ..
发布时间:2021-09-30 20:14:16 移动开发

Microsoft Speech API 与 Windows Store 应用程序一起使用了吗?

Microsoft Speech API 现在可用吗?我真的需要在我的项目中使用它.我需要接收一些简短的关键字语音命令并按照用户的要求执行任务.另外,我想使用文字转语音 到目前为止,我发现它不能与 Windows Store Apps 一起使用,但这些答案来自半年前...... 如果有人知道答案或对我可以在我的项目中使用的任何语音 API 有建议,我将不胜感激. 解决方案 当您 ..
发布时间:2021-09-27 18:44:28 C#/.NET

语音识别引擎未在 Windows 服务中触发事件

所以我有一个使用 system.speech 识别引擎实现语音识别的 Windows 服务.当我启动服务时,我的语音识别代码运行良好,但没有语音识别火灾事件.奇怪的是,如果我运行完全相同的代码,但在控制台或 WPF 应用程序中运行,则语音识别的事件触发工作正常. 我已经在我的服务进程中附加了一个调试器来检查幕后发生了什么.语音识别引擎似乎正确加载语法,将其模式设置为连续收听,并正确设置语音识别事 ..
发布时间:2021-09-27 18:35:48 C#/.NET

SAPI 和 Windows 7 问题

我正在尝试使用 Windows 7 识别语音,但它总是将语音识别为命令或只是说“那是什么?". 我如何获得所有演讲? 代码: SpeechRecognizer _speechRecognizer;公共窗口 1(){初始化组件();//设置识别器_speechRecognizer = new SpeechRecognizer();_speechRecognizer.Enabled = ..
发布时间:2021-09-26 18:40:18 其他开发

我的 UWP 应用程序中的默认听写语法无法识别语音.

我的 UWP 应用程序中的默认听写语法无法识别语音.但是,当我使用程序化列表约束时,它被完美识别.下面是我的代码的语音识别部分,供参考.如果我不评论第 5 行,这可以正常工作.我在下面做错了什么: SpeechRecognizer = new SpeechRecognizer();bool PermissionGained = 等待 CheckMicrophonePermission();如果 ..

Windows 10 语音识别

我想用 c# 为 windows 10 创建一个 WPF 应用程序.现在,我在以前的 windows 版本中遇到的问题是我是意大利语,并且不支持意大利语的语音识别.但现在有 Cortana.那么,如何在我的应用程序中使用 cortana 的语音识别引擎?如果我只是使用 new SpeechRecognitionEngine(new CultureInfo("it-IT"))); 它会给我一个错误, ..
发布时间:2021-09-26 18:31:14 C#/.NET

python中谷歌语音识别的“音频数据必须是音频数据"错误

我正在尝试在 python 中加载音频文件并使用谷歌语音识别进行处理 问题在于,与 C++ 不同,python 不显示数据类型、类,也不让您通过创建新对象和重新打包数据来访问内存以在一种数据类型和另一种数据类型之间进行转换 我不明白如何在 python 中从一种数据类型转换为另一种数据类型 有问题的代码如下, 将speech_recognition导入为spr导入 libros ..
发布时间:2021-09-25 20:16:42 Python

如何使用函数 GetStorageFileName 将训练文件添加到注册表?

我正在使用 sapi 5.4,我能够保留用于训练的音频,但可以将其添加到注册表项中,如本 使用 SAPI 5.3 Speech API 进行声学训练 我无法理解用于 ISpObjectToken::GetStorageFileName 的参数有人可以帮助我它吗? 解决方案 ISpObjectToken::GetStorageFileName 并不是世界上记录最完整的 API.幸运的是,我有 ..
发布时间:2021-09-25 19:57:17 其他开发

webkitspeechrecognition 不再提示许可

我一直在设计一些使用 webkitspeechrecognition 的页面.我很快了解到您无法从文件中加载这些内容,您必须从网络服务器上提供它们.我正在使用 osx,所以我只是将我的文件移动到已经运行并启用的本地 apache.这在很长一段时间内都运行良好. 出于某种原因,我运行良好的页面都不会提示我拒绝/允许使用麦克风.我什至从另一个网络服务器复制了一个现有的工作页面,如果我从 http ..
发布时间:2021-09-23 18:43:35 前端开发

使用 Web Speech API 检测已知单词

我正处于一款旨在帮助儿童学习词汇的网络应用的规划阶段.我们希望使应用程序尽可能具有交互性.例如,我们会展示一个苹果的图片,并让孩子识别这个物体.然后孩子会说“apple",我们会判断他们是否正确,等等. 新的网络语音API 似乎是这个项目的一个很有前途的工具.但是,查看文档后,我相信它只会从语音中生成成绩单(即它无法将口语单词与已知 单词匹配并生成置信度值——至少不是开箱即用的). 有 ..
发布时间:2021-09-22 19:52:16 其他开发

语音识别算法是如何识别同音字的?

我之前也在思考这个问题.现代算法(特别是那些将语音转换为文本的算法)使用哪些线索来确定说的是哪个同音字(例如,to、too 或两个?) 他们是否使用上下文线索?句子的结构?也许每个单词的发音方式略有不同(例如,我通常在 two 中比在 to 中保持 o 音的时间更长).前两者的组合似乎最合理. 解决方案 他们是否使用上下文线索? 是的,ASR 系统使用填字游戏上下文.例如, ..
发布时间:2021-09-20 18:33:53 其他开发

Python Pocketsphinx:使用解码器类时无法识别关键字

我正在尝试使用 Pocketsphinx 从 .wav 文件中检测关键字,特别是使用解码器类.当我给它 this .wav 文件并打印它检测到的内容时,它甚至没有关闭.代码如下: 导入pocketsphinx为ps进口请求导入json导入系统,操作系统导入子流程模型路径 = ps.get_model_path()数据路径 = ps.get_data_path()打印(“开始")打印(os.get ..

CMU Sphinx 4 - 5 pre alpha 安装指南

CMU Sphinx 4 -5prealpha(最新版本)有什么好的,最好是分步安装指南?我找不到任何官方指南已经过时了.我一直在尝试按照这些步骤操作,但是在我完成后,我缺少 2 个 jar(jsapi 和标签),如果我尝试在 eclipse 找不到任何类之前从版本中获取它们.我在为 Eclipse 设置此类项目方面没有太多经验,我之前所做的只是创建了一些自定义库,这就是为什么我要求逐步构建.欢迎 ..
发布时间:2021-09-20 18:33:33 Java开发

SFSpeechRecognizer 多种语言

我正在构建一个支持语音识别并将语音转换为文本的搜索,因此我使用了 SFSpeechRecognizer.但是问题是我需要同时支持多种语言比如 ("en_US", "fr", vi, ar). 主要想法是用户可以用英语说一个单词,另一个用法语说,我希望引擎检测到这一点. 目前,我正在使用它来设置我的主要语言 英文: private let speechRecognizer = S ..

.Net 中的语音转音素

问题是我想用 C# 语言获取音频语音的音素.假设你有一个像“x.wav"这样的音频文件,上面写着“你好,亲爱的沙米姆".我想提取语音的所有音素及其相对时间.类似于下图: 我使用了 System.Speech 库(recognition 和 synthesis 命名空间),但我没有找到我想要的.现在不要误会!我不想要句子“你好,亲爱的 Shamim"的音素,我想从一个未知的语音输入和英语句子中 ..
发布时间:2021-09-20 18:32:55 C#/.NET

Android 中的语音活动检测

我正在编写一个应用程序,它的行为类似于现有的语音识别,但会将声音数据发送到专有网络服务以执行语音识别部分.我正在使用标准的 MediaRecord(它是 AMR-NB 编码的),它似乎非常适合语音识别.它提供的唯一数据是通过 getMaxAmplitude() 方法提供的 Amplitude. 我试图检测此人何时开始说话,以便当此人停止说话约 2 秒钟时,我可以继续将声音数据发送到 Web ..

使用 SpeechRecognition 更改语音合成语音

我正在将 SpeechRecognition 与我的麦克风一起使用,并通过 SpeechSynthesis 将数据转发给我. 我在页面加载时将声音设为女声,并希望能够通过说“男声"切换为男声,然后转播“我现在是男人".后来我也希望能够做相反的事情 - 当它设置为男声时,说“女声"然后它切换回来. 我目前可以这样做,但男声只会说一次,因为声音不会被保存,只会作为参数传递.因此,接下来说的 ..
发布时间:2021-09-20 18:32:44 前端开发

Android:谷歌语音识别服务器

我目前正在使用适用于 Android SDK 的 Google 语音识别 API.我想知道的是他们语音识别的网址.您需要数据连接才能使用该功能,因此显然他们正在解析服务器端的内容.有人知道这个网址吗? 解决方案 好的,这是我发现的,基于 这篇 文章. 以下是语音搜索中各种 HTTP 和 TCP 操作的完整 TCP 转储: POST/m/voice-search HTTP/1.1内 ..
发布时间:2021-09-20 18:32:38 移动开发