持续识别Android上的所有内容? [英] Continuously recognize everything being said on Android?

查看:25
本文介绍了持续识别Android上的所有内容?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在做一个项目,涉及Android上的语音识别。我有一些问题在这个网站上没有明确的答案(或者实际上是任何问题)。我需要做一些类似于演讲到文本的事情,问题是我需要它连续工作,想象一个应用程序在后台运行,并将它在txt上听到的一切写下来。我知道我需要纠正很多"噪音听力",但它会在稍后出现。

我正在使用PocketShinx-Android,并尝试遵循以下教程: http://cmusphinx.sourceforge.net/wiki/tutorialandroid

当我尝试进行连续识别时,问题出现了,因为本教程只显示了从教程中获取的搜索单词的步骤:"关键字激活搜索"、"基于语法的搜索"和"语言模型搜索"。这是我第一次录音,我完全迷路了,如果有人能给我指明方向就太好了!

推荐答案

如果您想在安卓上识别大词汇量的语音,您需要进行语言模型搜索。您可以使用泛型语言模型来识别没有约束的语音:

https://sourceforge.net/projects/cmusphinx/files/Acoustic%20and%20Language%20Models/US%20English%20Generic%20Language%20Model/

然而,这将是一个相当耗费资源的过程,如果没有专门化,精确度将不会很高,您将不得不修剪模型以使其适合在移动设备上解码。因此,您的另一个选择是将音频流传输到某个服务器,在那里您可以使用更强大的模型来识别它,或者只使用现有的语音识别API,该API允许连续解码。

这篇关于持续识别Android上的所有内容?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆