speech - IT屋-程序员软件开发技术分享社区

如何获取iOS9上所有声音的列表？

获取“所有”AVSpeechSynthesisVoice对象列表的标准方法是请求它： [AVSpeechSynthesisVoice speechVoices] 但是，这仅显示每个语言区域对的唯一默认语音。例如，EN-US： "Language: en-US, Name: Samantha, Quality: Default", 如果我在下面的设置应用程序中查看 General ..

发布时间：2022-04-18 21:20:58 ios cocoa text-to-speech speech 移动开发

语音识别和声音与音乐的比较

我正在尝试制作一款具有语音识别功能的Android应用程序，但不幸的是，Google不支持我的语言(马其顿语)，我正在尝试比较两种录音的声音。我正在使用http://code.google.com/p/musicg/来记录和比较语音，我正在堆叠初始化语音检测的设置。有人可以告诉我如何重写语音检测的初始化函数，这对我来说非常重要。或者其他一些想法如何做到这一点。这是哨声检测的初始化 ..

发布时间：2022-04-02 10:19:48 android speech-recognition speech 移动开发

从Google Speech API结果中检测流畅度

我正在尝试使用Google Speech(转换为文本)API确定演讲者的流利度。到目前为止，我发现接口(Betav1)可以显示说出一个单词的时间(开始时间和结束时间)。和来自维基百科的口语流利度或口语流利度都是衡量产出的标准和接受演讲，作为一个流利的演讲者必须能够在谈话中理解并回应他人。口语是典型地以看似不流利的品质为特征(例如，支离破碎、停顿、错误开始、犹豫、重复 ..

发布时间：2022-04-02 09:57:16 speech-recognition speech google-speech-api 其他开发

Microsoft语音识别定制培训

我一直想创建一个使用Microsoft语音识别的应用程序。我的应用程序的用户应该经常说缩写的东西，比如‘LHC’代表‘大型强子对撞机’或‘CERN’。根据该顺序，我的应用程序将返回你说：在C岁的时候您说：CERN 虽然它对‘CERN’有效，但对‘LHC’却失败得很厉害。然而，如果我可以制作自己的定制培训文件，我就可以很容易地在其中的某个地方放置术语LHC。然后，我 ..

发布时间：2022-04-02 09:46:08 python speech-recognition speech sapi Python

用于语音检测和识别的开源代码

我有15盘录音带，我相信其中一盘包含了我和祖母交谈的旧录音。快速地试图找到合适的地方，但没有找到。我不想听20个小时的磁带才能找到它。位置可能不在其中一盘磁带的开头。大多数内容似乎分为三类--按照总长度的顺序，最长的是：静音、语音广播和音乐。我计划将所有磁带转换为数字格式，然后再次查找录音。最明显的方法是在我做其他事情的时候在背景中播放它们。这对我来说太直截了当了，所以：有没有什么开源库或 ..

发布时间：2022-04-02 09:25:49 speech-recognition speech pyaudioanalysis 其他开发

C#Syst.Speech.识别替换字词

我目前正在使用Microsoft.Speech API将话语口述为文本，但我真正需要的是该程序可以使用的其他口述。我用这个作为我的荣誉论文，因此我希望知道对任何话语的前十种解读。 2011年，人们提出了一个非常类似的问题，如果不是很准确的话： C# system.speech.recognition alternates 但一直没有人接电话。因此，我的问题是：如何使用Microsoft.S ..

发布时间：2022-04-02 09:15:45 c# speech-recognition speech speech-to-text C#/.NET

语音识别和语音合成入门

我想开始学习语音识别和语音合成在Prototype based on speech recognition 有人告诉我使用Microsoft语音服务器(SDK等) 当我有了这些，我如何编写应用程序，以及使用哪种编程语言(开发环境？)？是否有使用Asterisk或SVOX的经验？我需要做的是：语音识别语音合成我不一定要很好地识别语音--我认为一开始30-50个单 ..

发布时间：2022-04-02 09:08:09 speech-recognition speech speech-synthesis 其他开发

如何向Microsoft SAPI添加自定义SR(语音识别)

我有一个用于语言X的语音识别应用程序。 Microsoft SAPI不支持此语言。如何将用于语言X的此SR添加到Microsoft SAPI，以便可以通过Microsoft SAPI使用它？所以我想知道的是我可以向Microsoft SAPI添加自定义SR吗？如果是，如何操作？如果这是一个复杂的过程，从哪里可以找到详细信息？推荐答案只是应用程序编程接口 ..

发布时间：2022-04-02 09:06:46 speech-recognition speech sapi speech-synthesis 其他开发

只对数字(1到10000)进行语音识别的接口还是sdk？

我需要一个专门的解决方案来检测1到1000之间的数字，以便在智能手机上使用。最好的解决方案是让这个SDK脱机工作。有什么想法吗？我找不到Google Speech或Amazon Transcribe的任何配置以允许“仅数字” 推荐答案从人们那里得到数字是不太对的，即使你向他们要数字，他们通常也会说很多话，比如“我不知道”或“稍等一下”。您将严重损害体验。您必须智能地分析 ..

发布时间：2022-04-01 23:52:48 speech-recognition speech-to-text speech 其他开发

PySpeech(Python)-转录MP3文件？

我想使用pySpeech API转录mp3(语音到文本)。不过，我不知道这是否可能。是吗？如何？推荐答案我不知道关于pySpeech的事情，但如果它是微软Speech API的包装器，那么其他一些帖子可能会有帮助。 Microsoft语音引擎不需要麦克风输入。他们可以接受音频文件。如果你在做抄写，你需要一本听写语法。听写语法包含在Windows 7和Vista附带 ..

发布时间：2022-04-01 23:44:14 python speech-recognition speech speech-to-text Python

使用SAPI 5.3语音API进行声学培训

在Vista上使用Microsoft的SAPI 5.3语音API，如何编程进行RecoProfile的声学模型训练？更具体地说，如果您有一个文本文件和一个说出该文本的用户的音频文件，您会执行什么序列的SAPI调用以使用该文本和音频训练用户的配置文件？更新：有关此问题的详细信息我仍未解决：您在"；处调用ISpRecognizer2.SetTrainingState(true ..

发布时间：2022-04-01 23:36:04 speech-recognition sapi speech 其他开发

在代码中处理语音命令以执行命令的智能方法

与其使用可能会变得非常冗长且非常乏味的 Switch/Case 或 IF 布尔检查，我想知道是否可以找到更好的方法来处理和处理命令. 例如: if(settings.getName == 命令){说话(“我在这里")；}if("获取新闻提要" == 命令){MyRSSFeed RSSNewsFeed = new MyRSSFeed();RSSNewsFeed.GetFeed();} if ..

发布时间：2022-01-23 08:46:25 c# command controls speech C#/.NET

谷歌语音识别 API

我正在尝试使用 Google Speech API v2(地址 https://www.google.com/speech-api/v2/recognize?...) 我需要使用我的 Api 密钥，但是当我使用它时，我收到 error 403 Forbidden 当我使用我下载的示例项目中的 API 密钥时，它工作正常. 我在 Google Developers Console ..

发布时间：2022-01-01 20:27:18 google-api speech-recognition speech 其他开发

System.Speech.Recognition 和 Microsoft.Speech.Recognition 有什么区别?

.NET 中有两个类似的命名空间和程序集用于语音识别.我正在尝试了解这些差异以及何时适合使用其中一种. 有 System.Speech.Recognition 来自程序集 System.Speech(在 System.Speech.dll 中).System.Speech.dll 是 .NET Framework 类库 3.0 及更高版本中的核心 DLL 还有来自程序集 Microso ..

发布时间：2021-12-02 13:40:14 .net speech-recognition speech ucma2.0 ucs C#/.NET

用于检测人声、性别、年龄和情绪的音频分析——之前做过任何开源工作吗?

在“音频分析"领域是否有先前的开源工作来检测人声(比如尽管有一些背景噪音)，确定说话者的性别，可能确定否.演讲者的数量、演讲者的年龄以及演讲者的情绪? 我的预感是，像 CMU Sphinx 这样的语音识别软件可能是一个不错的起点，但如果有更好的东西，那就太好了. 解决方案我是一名从事语音识别研究的研究生.这些都是开放的研究问题，不幸的是，我不知道可以开箱即用的开源软件包. 如 ..

发布时间：2021-11-27 11:59:59 speech-recognition analysis speech emotion 其他开发

是否有 Web Speech API 限制?

我正在使用 W3C 浏览器网络语音 Api.我到处搜索，但找不到答案.有使用限制吗? 演示:https://www.google.com/intl/en/chrome/demos/speech.html 解决方案是的，有一点问题.经过大量实验，我最近终于达到了极限；一旦请求开始，它就会被缩短.在桌面网络浏览器 (Chrome) 上，有每个用户的限制(Primiano Tucci ..

发布时间：2021-11-15 02:24:43 api web speech webspeech-api 其他开发

是否有 Web Speech API 限制?

我正在使用 W3C 浏览器网络语音 Api.我到处搜索，但找不到答案.有使用限制吗? 演示:https://www.google.com/intl/en/chrome/demos/speech.html 解决方案是的，有一点问题.经过大量实验，我最近终于达到了极限；一旦请求开始，它就会被缩短.在桌面网络浏览器 (Chrome) 上，有每个用户的限制(Primiano Tucci ..

发布时间：2021-11-15 02:24:28 api web speech webspeech-api 其他开发

演讲中的关键词发现

是否有人知道免费提供的关键字发现系统，并且可能提供 API ?? CMU Sphinx 4 和 MS Speech API 是语音识别引擎，不能用于 KWS. SRI 有一个关键字识别系统，但没有下载链接，甚至没有用于评估的链接.(我什至在任何地方都找不到联系他们的软件的链接) 我在这里找到了一个，但它是一个演示版且有限. 解决方案 CMUSphinx 在 Pockets ..

发布时间：2021-11-15 01:23:55 api keyword speech 其他开发

JAVA 使用谷歌语音识别 API

我正在尝试使用谷歌语音识别 API.这是我写的代码: http://pastebin.com/zJEhnJ74 它有效.我从服务器得到答复: {"status":5,"id":"8803471b14a2310dfcf917754e8bd4a7-1","假设":[]} 现在的问题是“状态:5".事实上，这是状态代码: 状态:0 – 正确，状态:4 – 缺少音频文件，状态:5 – 不 ..

发布时间：2021-11-15 01:05:53 java api speech Java开发

使用 Google 语音 API

在我的基于 C# 的应用程序中实现 Google Speech API 的代码是什么?我发现可以创建音频文件并将其发送到 http://slides.html5rocks.com/#speech-input 并将其作为文本接收.如果您以前尝试过，能否请您解释一下如何执行此操作或向我提供代码?卡在这里好久了非常感谢. 到目前为止的代码: SpeechRecognitionEngin ..

发布时间：2021-11-15 00:55:25 c# api speech C#/.NET

speech相关内容