audio-fingerprinting相关内容

如何找出一段音频在另一段音频中开始和结束的时间?

我有两个音频文件,其中一个句子由两个不同的人朗读(就像唱一首歌一样)。所以它们有不同的长度。他们只是发声,里面没有乐器。 A1:音频文件1 A2:音频文件2 例句:“Lorem ipsum door sit amet,.” 我知道每个单词以A1开头和结尾的时间。我需要自动找出A2中每个单词的开始和结束时间。(任何语言,最好是Python或C#) 时间以XML格式保存。所以,我 ..
发布时间:2022-02-26 15:43:21 其他开发

如何比较/匹配两个不同的声音片段

我需要每5秒钟进行一次简短的声音采样,然后将其上传到我们的云服务器. 然后,我需要找到一种方法来比较/检查该样本是否是完整的长音频文件的一部分. 样本将通过电话麦克风记录下来,因此它们的确是不准确的. 我知道这个主题可能会变得技术性很复杂,但是我确信必须有一些库或在线服务可以帮助完成这种复杂的音频匹配/配对. 一个想法是使用音频到文本的转换服务,然后根据实际对话框进行匹配. ..
发布时间:2020-09-13 22:42:32 其他开发

将每分钟的MP3导出到单独的WAV中

这绝对是一个奇怪的问题,但我正在寻找一种方法,将60分钟的mp3混合内容拆分为60个1分钟长的独立wav文件,以与Echonest等音频指纹识别API一起使用. 在单个ffmpeg命令中是否可行?或者我必须使用以下值运行ffmpeg的多次迭代: -ss是以秒为单位的起点. -t是持续时间(以秒为单位). 解决方案 您可以在ffmpeg中使用段混合器: ffmpeg -i ..
发布时间:2020-09-13 22:13:04 其他开发

开源音频模式识别(指印)

是否有任何开源音频指纹识别解决方案提供“类似于Shazam的"解决方案? Shazam 使用 Landmark digital ,但我正在寻找一种替代方法(即使在准确性和性能方面也较差)开源解决方案. 任何人都对这种实现甚至是已发布的未实现算法一无所知吗? 解决方案 好.不同的搜索关键字,这是我寻找的所有结果. http://musicbrainz.org/doc/Aud ..
发布时间:2020-09-13 21:15:06 其他开发

在音频中检测音频[音频识别]

我需要构建一个软件,该软件可以从其他音频样本(B)中的一个小音频样本(A)进行音频识别,并输出A在来自B的音频中出现的次数(如果存在匹配项)./p> 我所拥有的:具有数百种音频的数据库 输入:新音频 期望的输出:如果输入与数据库中的样本匹配,并且匹配的音频(来自数据库)中的输入出现了多少次,则为布尔值. 任何代码,开源项目,指南,书籍,视频,教程等都非常有用!谢谢大家! ..

如何使用MFCC系数向量训练机器学习算法?

在我的最后一个项目中,我试图实时(通过录制声音片段)识别狗/树皮/鸟的声音.我正在使用MFCC作为音频功能.最初,我使用jAudio库从声音剪辑中总共提取了12个MFCC矢量. 现在,我正在尝试训练机器学习算法(目前我尚未确定算法,但很可能是SVM).声音片段的大小约为3秒.我需要澄清有关此过程的一些信息.他们是 我是否必须使用基于帧的MFCC训练此算法(每帧12个) 还是基于整个剪辑的MF ..

如何使用音频指纹获取音频标签

我有一个所有id3标签为null的音频文件。我想提取声音指纹并使用在线服务获取id3标签。 我怎样才能用Java做到这一点?是否有在线服务我可以传递音频指纹并返回标签? 解决方案 如果这是非商业性的应用程序,您可以使用 AcoustID 。 ..
发布时间:2019-01-08 13:58:21 Java开发

Echoprint iOS缺失框架

有没有人下载过EchoPrint的iOS版演示版?它是一个音频指纹识别开源软件。 我刚下载它但似乎缺少框架......任何可以获得功能的地方? 解决方案 按照步骤使框架运行 下载最新版本的提升。下载最新的1.51 链接 .0 for boost library 提取 boost_1_51_0.tar.gz 文件。 下载项目以生成 libechoprint-codegen-i ..
发布时间:2018-09-17 09:21:15 移动开发

创建自定义语音命令(的GNU / Linux)

我要找的建议,对于个人项目。 我试图创建定制的语音命令创建一个软件。的目标是允许用户/我记录一些音频数据(2/3秒),用于定义命令/宏。然后,当用户将讲话(记录相同的音频数据),命令/宏将被执行。 该软件必须能够在处理时间少于1秒,以检测一个命令以低成本计算机(树莓派,例如)。 我已经搜查方式有两种: - 语音识别(CMU-狮身人面像,朱利叶斯,西门):有很好的开源解决方案,但他们往往需要 ..
发布时间:2016-08-23 12:07:50 服务器开发

C#AudioFingerprinting和局部敏感哈希

香港专业教育学院发现simlar上岗前这个但没有真正回答了这个问题。 在我的指纹,我产生其中有5个整数一个记录集。例如: 33,42,88,121,194 这些对应于具有用于音乐的特定样品的最高幅值的频率。 例如:对音频采样我有以下的频率桶30ms的: 0-40 40-80 80-120 120-180 180-250 我试着去产生一个哈希(一颗宽容的一种),这将可能产生了相同 ..
发布时间:2016-07-22 18:52:02 C#/.NET

两个音频文件的在线比较

所以我希望比较两个音频文件,我有我的Andr​​oid手机上,并且其中一个是完全一样的,我希望通过麦克风录制。 我觉得他们应该是相当的基础和足够的相似音频能够得到一个相当不错的比较,我不是太担心这里的精度,只要至少有一些。 像花一整天试图让我的Andr​​oid手机来录制wav文件是用的 musicg库,不能够弄清楚我已经看到了在这里轻松地左右记录一个可用的wav文件的所有例子。我希望有可能是 ..
发布时间:2016-03-11 21:41:40 移动开发

安卓/ Java的echonest文件上传errorrr

所以,我一直在试图找出如何上传以供分析echonest服务器上的文件,但我无法,居然没有任何反应后:轨道轨道= echoNest.uploadTrack(文件,真); 字串[] args = {“/存储/ sdcard1 /音乐/驱动器配乐/一个真正的英雄(技艺电器青年。).MP3”}; 档案文件=新的文件(参数[0]); 如果(!file.ca ..
发布时间:2015-12-03 16:22:09 Java开发

音频指纹识别系统的Java

是否有任何音频指纹识别系统( PUID 等),这些在纯Java实现(在Android上运行)? 解决方案 索尼爱立信有一个纯Java的音频识别应用程序,叫的TrackID,他们的新的Andr​​oid手机。它也一直可以在J2ME和presumably其他手机了一段时间。它是由Cyber​​com开发的。 然而,它不产生一个指纹—的音频数据被发送到远程服务器进行识别。当你需要在线反 ..
发布时间:2015-12-02 22:50:21 Java开发

比较两个记录的声音

我需要找一些文学如何在实时录音(从MIC)针对pre-记录声音的数据库进行比较。比较之后,我会再需要输出它的匹配百分比。 我在研究上的音频指纹,但我不能真正对这种执行的任何文献中得出任何结论。任何专家在这里可以很容易地指导我实现这个? 解决方案 这绝对不是一个简单的问题。 如果你认真努力解决这个问题,我建议你仔细看看怎么演EN codeRS工作。 所涉及的步骤粗略击穿: 在确定的时间间 ..
发布时间:2015-11-30 21:18:44 C/C++