speech-to-text相关内容

Android:阿拉伯语语音识别-离线

任何人都可以帮助我或给我有关阿拉伯语音识别的提示-离线供Android使用吗? 我想开发一个简单的应用程序来进行语音识别-像在网上一样离线进行操作,我知道如何...如果有人有建议或链接到一个开源项目甚至图书馆购买以有效地做到这一点,那将是惊人的 提前谢谢. 解决方案 使用 intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE,"a ..

没有网络的Windows Universal App连续听写

在此提供以下示例之后: https://github.com/Microsoft/ Windows-universal-samples 概述了UWP应用程序的某些功能。但是,语音示例似乎需要主动连接到Internet。有谁知道在断开的公司网络上是否可以使用此功能? 谢谢,JRF 解决方案 是的,示例1、2、5、6和9脱机工作,因为它们不使用预定义的SRGS方案。在文件夹:SRGS中 ..
发布时间:2020-06-08 18:54:22 其他开发

这是什么错误-“ IOError:[Errno 2]没有此类文件或目录:“ audio.flac””,我正在尝试将google语音识别api用于python

基本上我想将语音转换为文本,所以我试图将google语音识别api用于python。 这是我正在尝试的代码运行 从pygsr导入Pygsr 语音= Pygsr() 语音.record(3) #以秒为单位的持续时间(3) 短语,complete_response = speech.speech_to_text('es_ES') 打印短语#这是必需的输出 我已经正确安装了 ..

flac:“错误:输入文件具有ID3v2标签" (没有)

我正在尝试构建一个冗长的程序和库链,最终使用语音到文本API将mp3文件运行为人类可读的文本.我很惊讶地发现很少有API可以在线执行此操作-我发现唯一可行的方法是speech2text项目: https://github.com/taf2/speech2text ,它可以插入Google非官方的语音转文本API. 这实际上起初是有效的.我进行了一些手动转换,并对结果感到满意.但是,由于尝试自 ..
发布时间:2020-05-12 19:37:15 Java开发

如何通过语音框架实现语音转文本

我想使用iOS语音框架在Objective-C应用中进行语音识别. 我找到了一些Swift示例,但是在Objective-C中什么也找不到. 是否可以从Objective-C访问此框架?如果可以,怎么办? 解决方案 花了足够的时间查找Objective-C示例-即使在Apple文档中-我也找不到合适的东西,所以我自己弄清楚了. 头文件(.h) /*! * Impo ..

Azure语音API语言

我已经在网页上实现了聊天,并可以通过Azure语音API使用语音转文本.它可以正常工作,但是我不知道在哪里可以设置API可以理解的语言. 我希望它能听懂法语,但是当我用法语交谈时,它会以熟悉的声音翻译成英语单词. 如何/在哪里设置语言? 我明确指出,我不是在Azure仪表板上设置服务的人. 解决方案 有一个locale参数,您可以选择使用它,例如以下export interface ICo ..

Microsoft认知服务-语音自定义测试处理似乎已冻结

根据Microsoft docs,我成功地将数据上传到语音自定义(wav音频+ txt转录)中,仅压缩了zip文件中的一种音频: https://docs.microsoft.com/zh-CN/azure/cognitive-services/speech-service /how-to-custom-speech-test-data .当我单击以添加测试时,我选择了数据,并且需要花费很多时间来 ..

Microsoft Speech产品/平台之间的差异

看来Microsoft提供了许多语音识别产品,我想知道它们之间的区别. 有 Microsoft Speech API 或SAPI .但是 Microsoft认知服务语音API 具有相同的名称. 好吧,现在,Azure上的Microsoft认知服务提供了语音服务API 和 Bing Speech API .我假设对于语音转文本,两个API都是相同的. 然后有 Microsoft.S ..

实时流中的语音转文字

我有一个Java应用程序,我想转录的不是Wowza提供的LIVE流(rtmp://或m3u8),而不是文件. 有可能吗? 谢谢 PS:我愿意为提供音频转录的那些云服务付费,但是我见过的似乎没有此功能. 解决方案 有一些选择! Google有一个处于测试阶段,但看起来非常有前途的!在这一点上,他们的文档略显不足,但这是一个很好的github示例. https://gi ..
发布时间:2020-05-02 10:40:37 其他开发

在Android中以编程方式在软输入键盘上禁用语音到文本按钮(麦克风)

预先感谢您的帮助. 我出于研究目的而开发了一个android应用程序,需要禁用软输入键盘上的语音转文本按钮.原因是由于我正在开发的应用程序使用麦克风后出现的并发问题.我了解,对于一般应用程序,禁用键通常被认为是不可能的(因为用户可以更改默认键盘).我知道将使用默认键盘. 考虑到这一点,可以禁用某些键吗?我相信至少我应该能够指定输入类型,以便隐藏麦克风按钮.我之所以这样说是因为,如果我在 ..
发布时间:2020-04-26 08:11:19 移动开发

x-webkit-speech已被删除。用于< input>的简单语音输入的JS替换

我在Chrome devtool的控制台中发现了这个警告: x-webkit-speech 不推荐使用输入字段属性。请改用JavaScript API。 那么输入字段上简单语音输入的最佳JS API替代是什么? 也许存在一个可以为我处理它的插件JS模块? 解决方案 回答我自己的问题: 为此目的做了一个Github项目: https://github.com/Dani ..
发布时间:2019-04-24 13:19:01 前端开发

如何在Android应用程序的语音识别中传递语言?

我一直在研究Android中的语音识别API,发现当语言设置发生变化时语音结果会有所不同,有没有办法以编程方式设置它?或者是否打算在语音设置屏幕上午餐?或者还有什么?注意:我试图使用额外的这个意图: intent.putExtra(RecognizerIntent.EXTRA_LANGUAGE_PREFERENCE,“en-US”); 和 Intent deta ..
发布时间:2019-01-08 18:50:42 Java开发

Android语音识别API在Android 7 Nougat中不起作用

我正在使用android.speech.SpeechRecognizer API进行演讲。 我在Android 4-5中效果很好, 在Android 6中它现在有一堆错误,比如麦克风打开时发出的响铃被检测为语音,所以它存在(并且当它重新启动时无限循环,因为检测到语音,我们有一个hack解决方法,在播放铃声之前将音量设置为0 ...) 在Android 6中,语音也会在5秒后死亡, ..

我可以在桌面应用程序中使用谷歌语音识别API

我想知道我是否可以使用谷歌的语音识别api作为我的桌面应用程序。我已经看到一些例子,我必须将语音转换为文件并发送到网址。但这将是一项繁琐的任务,因为在我的应用程序中,用户必须不断提交他的声音。那么有没有其他替代方法使用谷歌语音API。我最不感兴趣的是使用狮身人面像,因为它的准确性非常低,我不知道如何在字典中添加新单词而不将其添加到字典中它不会识别新单词。任何帮助将不胜感激。 解决方案 你指 ..
发布时间:2018-12-28 16:07:44 Java开发

用于在音频文件中转录语音的开源软件

有人可以推荐可靠的开源软件来转录wav文件中的英文语音吗?我研究过的两个主要程序是 Sphinx 和朱利叶斯,但我从来没有能够工作,每个转录文件的文档都是粗略的。 我正在开发64位Ubuntu 10.04,其回购包括sphinx2和julius,以及voxforge的julius英语声学模式。我专注于转录文件,而不是直接处理来自麦克风的声音,因为我已经放弃了期望像这样的项目与Ubuntu的音 ..
发布时间:2018-12-25 22:22:23 Java开发

语音转换为文本。?

对于我的Iphone应用程序,我需要对文本库进行语音处理。 任何人都可以建议我一个解决方案。 经过两天挖掘我发现的是 Google语音到文本API 和开源 OpenEars 库。 任何人都可以提出其中一个。哪一个更好。? 解决方案 我不认为Google API供公众使用。它们是由Google for Android和Chrome托管的服务。人们已经反过来设计了API并构建了一些库来让 ..
发布时间:2018-10-31 12:35:33 移动开发