声音样本识别库/ code [英] Sound sample recognition library/code

查看:485
本文介绍了声音样本识别库/ code的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我不想声音到文本软件。我需要的是以下内容:

I don't want sound-to-text software. What I need is the following:


  • 我会记录多个(比如50岁以上),音频流(电台录音)

  • 从唱片,我会庆祝有趣的音频片段 - 其长度范围从2至60秒 - 将有成千上万的几个这样的音频片段

  • 库应该能够从记录的声音数据流找到相同音频剪辑的其他实例

  • 信心的因素,应当报使用的和额外的输入端提供这样的认同能有更好的表现下一次

你知不知道这样的软件库? LGPL是最有价值的给我,但我可以去​​商业许可为好。

Do you know of such software library? LGPL would be most valuable to me, but I can go for commercial license as well.

音频剪辑将包含音乐,文字,效果,或它们的任意组合。所以,文本识别出了问题。

Audio clips will contain both music, text, effects, or any combination thereof. So, TEXT recognition is out of the question.

架构:C ++,C#胶水,CUDA如果可能的话

Architecture: c++, C# for glue, CUDA if possible.

推荐答案

我还没有发现任何库(还),但两个有趣的论文,这可能会给你术语和背景,以优化搜索:

I have not found any libraries (yet), but two interesting papers, which may give you terminology and background to refine your searches:

  • Audio Fingerprinting for Broadcast Streams
  • Audio Segment Retrieval using HMM

编辑:搜索音频指纹识别来实现的网页,既开源和商业

Searching for "Audio fingerprinting" came to a page of implementations, both open source and commercial.

  • http://wiki.musicbrainz.org/AudioFingerprint
  • Picard seems to be well established, and could be useful if your clips contain music.

下面是一个介绍了音频指纹

这篇关于声音样本识别库/ code的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆