声音样本识别库/ code [英] Sound sample recognition library/code
问题描述
我不想声音到文本软件。我需要的是以下内容:
I don't want sound-to-text software. What I need is the following:
- 我会记录多个(比如50岁以上),音频流(电台录音)
- 从唱片,我会庆祝有趣的音频片段 - 其长度范围从2至60秒 - 将有成千上万的几个这样的音频片段
- 库应该能够从记录的声音数据流找到相同音频剪辑的其他实例
- 信心的因素,应当报使用的和额外的输入端提供这样的认同能有更好的表现下一次
你知不知道这样的软件库? LGPL是最有价值的给我,但我可以去商业许可为好。
Do you know of such software library? LGPL would be most valuable to me, but I can go for commercial license as well.
音频剪辑将包含音乐,文字,效果,或它们的任意组合。所以,文本识别出了问题。
Audio clips will contain both music, text, effects, or any combination thereof. So, TEXT recognition is out of the question.
架构:C ++,C#胶水,CUDA如果可能的话
Architecture: c++, C# for glue, CUDA if possible.
推荐答案
我还没有发现任何库(还),但两个有趣的论文,这可能会给你术语和背景,以优化搜索:
I have not found any libraries (yet), but two interesting papers, which may give you terminology and background to refine your searches:
- Audio Fingerprinting for Broadcast Streams
- Audio Segment Retrieval using HMM
编辑:搜索音频指纹识别来实现的网页,既开源和商业
Searching for "Audio fingerprinting" came to a page of implementations, both open source and commercial.
- http://wiki.musicbrainz.org/AudioFingerprint
- 皮卡德似乎很好地建立,并且可能是有用的,如果您的剪辑包含音乐。
- http://wiki.musicbrainz.org/AudioFingerprint
- Picard seems to be well established, and could be useful if your clips contain music.
下面是一个介绍了音频指纹
这篇关于声音样本识别库/ code的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!