text-to-speech相关内容
我正在尝试通过 SSML 和 .NET SpeechSynthesizer (System.Speech.Synthesis) 更改语音文本的音调 SpeechSynthesizer 合成器 = new SpeechSynthesizer();PromptBuilder builder = new PromptBuilder();builder.AppendSsml(@"C:\Users\me\
..
我希望我的 iOS 应用程序使用文本到语音转换来向用户读取它从服务器接收到的一些信息,并且我还希望允许用户停止通过语音命令进行此类演讲.我已经尝试过像 OpenEars 这样的 iOS 语音识别框架,我发现问题在于它正在监听和检测应用程序本身“说"的信息,并且它干扰了用户语音命令的识别.> 是否有人在 iOS 中处理过这种情况并找到了解决方案?提前致谢 解决方案 实施起来不是一件小事.不
..
我正在通过 Google Cloud 的 text-to-speech API 生成语音,我想在说话时突出显示单词. 有没有办法获取口语或句子的时间戳? 解决方案 这个问题似乎很受欢迎,所以我想我会分享我最终做了什么.此方法可能仅适用于英语或类似语言. 我首先在任何导致说话中断的标点符号上拆分文本.每个“句子"都分别转换为语音.生成的音频文件在最后有看似随机的静音量,需要在加入
..
我尝试过 PyTTS(已弃用)和 PyTTSx(最推荐的)和两个 Google TTS 解决方案(gTTS 和另一个名为 Hung Truong 的人的解决方案),但它们都没有在 Python 3.4 下工作.似乎它们还没有被移植到 3.x. 我在 StackOverflow 和 Google 上搜索过这里,但所有建议的 TTS 解决方案都不适用于 Python 3.我使用的是 Window
..
我可以为文本转语音应用添加我自己的语音词典吗?如果可能的话,哪种开发语言最适合开发这样的应用程序有几种用于文本到语音的在线工具,但它们都有自己的声音.我必须像那个应用程序一样开发.请建议我如何继续我的概念. 解决方案 您可以使用诸如 Festival 之类的开源软件构建您的声音 或 Openmary.您需要精心准备约 1 小时的录音 还有一些商业服务允许您构建自定义语音,例如 Cer
..
我有一个使用文本到语音的 Xamarin Forms 应用程序.iOS 项目中的代码与官方 Xamarin 实现文本转语音指南中的代码完全相同 var SpeechSynthesizer = new AVSpeechSynthesizer();var SpeechUtterance = 新的 AVSpeechUtterance(文本){Rate = AVSpeechUtterance.Maxi
..
我正在使用 Bixby 开发人员工作室,并且创建了我的 UI 输出并且它可以工作.如何创建或控制语音输出? 解决方案 Bixby 将自动读取 UI 中的文本 - 如果这足够了,您就设置好了.(此处要小心 - 在良好的 VUX 设计中,UI 文本和语音文本通常是不同的.UI 文本通常较长,语音文本通常较短且更具表现力). 要使语音与 UI 文本不同,您应该在对话框中设置模板的语音键.您
..
我正在使用 Microsoft Speech Synthesis 并希望将输出重定向到我选择的输出音频设备. 到目前为止,我有以下代码: SpeechSynthesizer SpeechSynthesizer = new SpeechSynthesizer();SpeechSynthesizer.SpeakAsync("是的,它有效!"); 目前我正在使用: speechSynthes
..
我只是尝试使用 Microsoft.Speech.dll; 为 Text To Speech 运行简单的微软示例 使用系统;使用 Microsoft.Speech.Synthesis;命名空间 TTS{课程计划{public static void Main(string[] args){Console.WriteLine("测试TTS!");//初始化 SpeechSynthesizer 的
..
我想以音频和文本形式进行聊天机器人的响应. 所有使用 gTTS 的示例代码似乎都需要“将文本保存到文件中然后播放文件". 是否有其他方法可以简化流程,例如使用 gTTS 自动播放“来自聊天机器人的响应"? 解决方案 如果你简单地看一下 所以,完全按照那个例子中的内容做,但是用你的字符串代替文字 'hello': >>>从 gtts 导入 gTTS>>>从 io 导入 Byt
..
我在 Android-Chrome 上使用语音合成 API.问题是,尽管有 4 种英语语音可用,但浏览器始终使用美国英语,无论代码指定什么.我可以使用其他语言,例如法语,而不是其他英语语音,例如 en-AU、GB 或 IN. 此代码从 getVoices 数组中过滤出英式英语语音对象,并使用第一个说出单词“tomato".问题是这个词总是发音为“to-may-lo"而不是“to-mar-to
..
我正在尝试按照以下说明设置 Google Cloud Text-to-Speech API - https://cloud.google.com/text-to-speech/docs/quickstart我已成功按照步骤 1-6 设置 Google SDK 并使用服务帐户凭据进行身份验证.但是,当我尝试运行用于合成语音的示例 HTTP 请求时,我收到以下错误: Cloud Text-to-
..
这是我的中文TTS代码,虽然中文TTS引擎安装成功,但在speak功能中失败 使用 Microsoft.Speech.Synthesis;使用 System.Globalization;命名空间 TTS3{课程计划{static void Main(string[] args){//CultureInfo=new CultureInfo("zh-CN");SpeechSynthesizer sy
..
CONTEXT: 我的应用程序正在向用户拥有的任何 TTS 引擎发送句子.句子是用户生成的,可能包含标点符号. 问题:一些用户报告说 在 SVOX、Loquendo 和其他可能的平台上大声朗读标点符号(TTS 表示“逗号"等). 问题: 我应该去掉所有标点符号吗? 我是否应该使用这种API来转换标点符号? 我应该让 TTS 引擎处理标点符号吗? 看到 Loquendo
..
我在我的应用程序中使用识别侦听器界面将语音转换为文本.但是,我想在我说话时立即显示语音转换后的文本.如果我说 4-5 个单词,那么我一说第一个单词就应该显示出来.总之就像谷歌助手.我目前正在覆盖它的 onresults 方法并在调用此方法时显示结果.有没有办法一次检测一个单词并一个一个显示出来? https://drive.google.com/open?id=0BxHdMJXrMP2HRk
..
我想知道是否有办法将文本转语音数据保存为 mp3 或 Wav 文件格式,以便以后播放? SpeechSynthesizer reader = new SpeechSynthesizer();reader.Rate = (int)-2;reader.Speak("你好,这是来自 C-Sharp 中计算机 TTS 引擎的示例表达式); 我正在尝试将其保存在外部,以便稍后播放.做这个的最好方式是什么
..
我一直在阅读 Web Speech Api 文档 我已经做了一些例子,但我想改变声音但不是标准系统声音(通过执行 SpeechSynthesis.getVoices() 获得的声音).SpeechSynthesisVoice 对象具有表示语音合成服务的 voiceURI 属性.我认为我需要制作一个 SpeechSynthesisVoice 对象来指示我的语音合成服务,但我不知道如何制作或在哪里可以
..
我安装了一些带有语音选项的英语语言包(美国、英国和加拿大),我可以在 Windows 10 设置中访问它们 -> 语音,但它们没有显示在控制面板提供的文本到语音选项中,我不能在应用中使用语音! 我可以只使用默认的声音,即 David 和 Zira ! 知道如何使用其他声音吗? 解决方案 Windows 10 默认安装了两个不同的 TTS 引擎.有 WinRT 语音合成 API(
..
是否可以在使用 SpeechSynthesisUtterance API 时选择正在阅读的单词? 是否有一个事件可以用来获取当前所说的单词和光标位置? 这是我目前所拥有的: var msg = new SpeechSynthesisUtterance();var voices = window.speechSynthesis.getVoices();msg.voice = 语音[10
..
我正在尝试找到一种方法来获取合成语音并将其录制到音频文件中.我目前使用 pyttsx 作为我的文本到语音库,但没有机制将输出保存到文件中,仅直接从扬声器播放.我研究了检测和录制音频以及PyAudio,但这些似乎从麦克风获取输入,而不是将传出的音频重定向到文件.有没有已知的方法可以做到这一点? 解决方案 您可以通过以下方式调用 espeak -w 参数使用 subprocess. 导入子流
..