语音识别,NodeJS [英] Speech recognition, nodeJS

查看:16
本文介绍了语音识别,NodeJS的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我目前正在开发一个工具,由于连接到不同的API,我可以阅读所有通知。

它工作得很好,但现在我想放一些语音命令来做一些操作。

就像当软件显示"一封来自Bob的邮件"时,我想说的是"阅读它"或"存档它"。

我的软件通过节点服务器运行,目前没有任何浏览器实现,但它可以是计划。

在节点JS中启用语音到文本的最佳方式是什么?

我在它上面看到了很多线程,但主要是使用浏览器,如果可能的话,我想在开始时避免这种情况。有可能吗?

另一个问题是某些软件需要输入wav文件。我没有任何文件,我只是希望我的软件始终听我说的话,以便在我说命令时做出反应。

您有关于我如何做到这一点的任何信息吗?

干杯

推荐答案

这里的两个答案都是正确的,但我认为您正在寻找的是Sonus。它为您处理音频编码和流媒体。它总是离线监听可定制的热词(如Siri或Alexa)。您还可以通过编程方式触发侦听。结合say这样的模块,您可以通过执行以下操作来启用您的示例:

say.speak('One mail from Bob', function(err) {
  Sonus.trigger(sonus, 1) //start listening
});

您还可以使用不同的热词以不同的方式处理后续识别的语音。例如:
"通知。最新。"和"发送消息。您今天好吗?"

把它放到桌子上有麦克风的PI或芯片上,你就有了一个私人助理,它会读取你的通知并对命令做出反应。

简单示例:
https://twitter.com/_evnc/status/811290460174041090

更复杂的东西:
https://youtu.be/pm0F_WNoe9k?t=20s

完整文档:
https://github.com/evancohen/sonus/blob/master/docs/API.md

免责声明:这是我的项目:)

这篇关于语音识别,NodeJS的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆