只对数字(1到10000)进行语音识别的接口还是sdk? [英] API or SDK to make speech recognition only for numbers (between 1 and 10000)?

查看:18
本文介绍了只对数字(1到10000)进行语音识别的接口还是sdk?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我需要一个专门的解决方案来检测1到1000之间的数字,以便在智能手机上使用。 最好的解决方案是让这个SDK脱机工作。 有什么想法吗? 我找不到Google Speech或Amazon Transcribe的任何配置以允许"仅数字"

推荐答案

从人们那里得到数字是不太对的,即使你向他们要数字,他们通常也会说很多话,比如"我不知道"或"稍等一下"。您将严重损害体验。

您必须智能地分析识别结果,即使识别出非数字,您也必须相应地操作。

要提高数字的准确性,可以使用Google Speech API的word hint feature。只需添加数字和其他必填字作为提示,谷歌就会更准确地识别它们。亚马逊也有这个功能,他们称之为"custom vocabulary"。

如果您想使用离线API,您当然可以尝试Kaldi。你可以adapt Kaldi vocabulary用数字来提高准确度,它会比Google API好得多。

这篇关于只对数字(1到10000)进行语音识别的接口还是sdk?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆