在给定大量单词的情况下,如何有效地创建用于语音识别的语法文件? [英] How do you efficiently create a grammar file for speech recognition given a large list of words?
本文介绍了在给定大量单词的情况下,如何有效地创建用于语音识别的语法文件?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
只用50个单词就可以轻松编写语音识别语法文件,因为您只需手动完成即可。如果您有10,000或100,000个单词,最简单、最有效的方法是什么?
示例:
比方说我们有"RC可乐"和"百事可乐"。我们将拥有包含2条规则的语法文件:
饮料:(可乐?[可乐苏打水])
COLANAME:[RC Pepsi]
它将识别"RC"、"RC Coke"、"RC Cola"、"RC Soda"、"Pepsi"、"Pepsi Coke"、"Pepsi Cola"和"Pepsi Soda"。
编辑: 我说的是语音识别的语法。语音识别系统需要一个附带的语法文件,以便它们知道要识别什么(gsl、grxml)。事实上,我也在考虑不只是任何单词,而是一些你不能归类的名字。
推荐答案
我没有解决我的问题的答案,但Yuval的答案清楚地表明,这是一个仍在发展中的学科,它不是一个足够成熟的学科。我明白,现在可能没有简单的语法修复方法(至少在研究实验室之外是这样)。现在做好语法的唯一解决方案可能是不断学习用户输入和灵活地重构语法文件。
这篇关于在给定大量单词的情况下,如何有效地创建用于语音识别的语法文件?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文