语音识别,NodeJS [英] Speech recognition, nodeJS
本文介绍了语音识别,NodeJS的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我目前正在开发一个工具,由于连接到不同的API,我可以阅读所有通知。
它工作得很好,但现在我想放一些语音命令来做一些操作。
就像当软件显示"一封来自Bob的邮件"时,我想说的是"阅读它"或"存档它"。
我的软件通过节点服务器运行,目前没有任何浏览器实现,但它可以是计划。
在节点JS中启用语音到文本的最佳方式是什么?
我在它上面看到了很多线程,但主要是使用浏览器,如果可能的话,我想在开始时避免这种情况。有可能吗?
另一个问题是某些软件需要输入wav文件。我没有任何文件,我只是希望我的软件始终听我说的话,以便在我说命令时做出反应。
您有关于我如何做到这一点的任何信息吗?
干杯
推荐答案
这里的两个答案都是正确的,但我认为您正在寻找的是Sonus。它为您处理音频编码和流媒体。它总是离线监听可定制的热词(如Siri或Alexa)。您还可以通过编程方式触发侦听。结合say这样的模块,您可以通过执行以下操作来启用您的示例:
say.speak('One mail from Bob', function(err) {
Sonus.trigger(sonus, 1) //start listening
});
您还可以使用不同的热词以不同的方式处理后续识别的语音。例如:
"通知。最新。"和"发送消息。您今天好吗?"
把它放到桌子上有麦克风的PI或芯片上,你就有了一个私人助理,它会读取你的通知并对命令做出反应。
简单示例:
https://twitter.com/_evnc/status/811290460174041090
更复杂的东西:
https://youtu.be/pm0F_WNoe9k?t=20s
完整文档:
https://github.com/evancohen/sonus/blob/master/docs/API.md
免责声明:这是我的项目:)
这篇关于语音识别,NodeJS的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文