非英语语言的语音到文本转换 [英] Speech to text conversion for non-english language
问题描述
我正在尝试实现非英语语言的朴素语音到文本的转换。用户使用其他语言说话,而文本也使用相同的语言。这可能吗?如果是的话,有谁能帮助我们想出如何实施它的想法呢?如有任何帮助,我们将不胜感激。提前谢谢。
推荐答案
任何商业语音识别解决方案都不太可能支持梵文,因此您唯一的选择是将对梵文的支持添加到开源引擎(如CMUSphinx)中。
这非常简单,您实际上只需要按照文档操作,就可以切中要害。您还需要具备脚本语言知识,这将帮助您减少某些步骤的手动工作。
阅读简介-CMUSphinx教程简介将成为 熟悉语音识别的概念-功能、声学 模型、语言模型等
尝试CMUSphinx与美国英语模式,以了解事情是如何 工作。尝试使用示例美国英语AN4数据库进行培训。
在维基百科上阅读您的语言
收集一组您所用语言的转录录音- 访谈、有声读物或自己录制。
根据您收集的数据,创建一个单词列表和一个 拼音词典。大多数拼音词典都可以创建 用一个简单的规则和你最喜欢的脚本中的一个小脚本 像Python这样的语言。参见Generating a dictionary for details。
手动或使用sphinx4将音频分段为短句 Aligner,创建包含所需文件的数据库,如中所述 培训教程Training Acoustic Model For CMUSphinx
将新模型集成到您的应用程序中并设计数据
集合以改进您的模型。
如果您有问题,请随时提问。This paper也可能对您有所帮助。
相关问题有:
Burmese speech to text conversion in android?
Writing speech-recognition engine
Is it possible to write a speech-recognition engine from scratch?
这篇关于非英语语言的语音到文本转换的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!