非英语语言的语音到文本转换 [英] Speech to text conversion for non-english language

查看:18
本文介绍了非英语语言的语音到文本转换的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在尝试实现非英语语言的朴素语音到文本的转换。用户使用其他语言说话,而文本也使用相同的语言。这可能吗?如果是的话,有谁能帮助我们想出如何实施它的想法呢?如有任何帮助,我们将不胜感激。提前谢谢。

推荐答案

任何商业语音识别解决方案都不太可能支持梵文,因此您唯一的选择是将对梵文的支持添加到开源引擎(如CMUSphinx)中。

这非常简单,您实际上只需要按照文档操作,就可以切中要害。您还需要具备脚本语言知识,这将帮助您减少某些步骤的手动工作。

  1. 阅读简介-CMUSphinx教程简介将成为 熟悉语音识别的概念-功能、声学 模型、语言模型等

  2. 尝试CMUSphinx与美国英语模式,以了解事情是如何 工作。尝试使用示例美国英语AN4数据库进行培训。

  3. 在维基百科上阅读您的语言

  4. 收集一组您所用语言的转录录音- 访谈、有声读物或自己录制。

  5. 根据您收集的数据,创建一个单词列表和一个 拼音词典。大多数拼音词典都可以创建 用一个简单的规则和你最喜欢的脚本中的一个小脚本 像Python这样的语言。参见Generating a dictionary for details

  6. 手动或使用sphinx4将音频分段为短句 Aligner,创建包含所需文件的数据库,如中所述 培训教程Training Acoustic Model For CMUSphinx

  7. 将新模型集成到您的应用程序中并设计数据 集合以改进您的模型。

如果您有问题,请随时提问。This paper也可能对您有所帮助。

相关问题有:

Burmese speech to text conversion in android?

Writing speech-recognition engine

Is it possible to write a speech-recognition engine from scratch?

这篇关于非英语语言的语音到文本转换的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆