audio相关内容

算法匹配的歌曲

说我有20首歌曲在我的iPhone的音乐收藏 这首歌出现这可能是也可能不是一首歌我已经在我的收藏完全相同的副本在电视机上。 (没有封面,确切的同一首歌 - 这应该使它更容易一些) 我记录20秒了这首歌曲的使用我的iPhone。 我需要一个算法来检测这首歌无论是在我收集的一些相匹配的歌曲。 这是调用我的第一个端口。随着研究产生的结果,我会添加一个答案,我自己的问题,或者编辑的问题。 因此 ..
发布时间:2015-11-30 16:15:19 C/C++

算法的音乐模仿?

我很感兴趣,自动音乐制作。我在想这是喂了大量的1杆琶音(音符=固定长度的序列,为简单起见),并生成自己的序​​列的基础上,它学会了编程。 首先,我知道我可以使用字母(双字母组合?卦?)的频率分析的,只适用于注意的间距,然后生成基于频率概率我的序列 有没有你认识的更先进的算法,或许EX pressly教音乐的序列? 解决方案 在算法组成维基百科的文章是一个极好的底漆。它描述了一些用于算法的音 ..
发布时间:2015-11-30 16:14:46 C/C++

节奏检测通过音频频谱分析

我建立一个节奏的游戏,并面临着很多问题,心律检测。我收到的播放的歌曲的电流频谱。它看起来像一个float数组512浮动。 256为左和右声道再presentation。 FFT也可以。但我不知道如何使用这些数据来工作,我做了一些实验,可视化,但它给了我极少数的信息。我GOOGLE了一些现成的算法,但并没有什么。请,有人可以帮我,也许,一些参考资料,材料,物品有节奏检测连接,用音频频谱工作。 cod ..
发布时间:2015-11-30 16:14:29 C/C++

强大的算法色仪器调谐器?

谁知道最稳健的算法,一个色仪器调谐器? 我想写的仪器调谐器。我曾尝试以下两种算法: FFT创建Welch周期,然后检测峰值频率 一个简单的自相关(http://en.wikipedia.org/wiki/Autocorrelation) 我遇到了以下基本问题: 精度1:在FFT的采样率,记录长度和块大小之间的关系是固定的。这意味着,我需要记录1-2秒的数据来获得几美分的精度。这不 ..
发布时间:2015-11-30 16:06:36 C/C++

算法,以确定是否音频音乐

我不能完全肯定这是正确的堆叠交换子网站张贴了这个问题,但... 我在寻找一种算法,我可以用它来确定的确定性体面的数额,如果给定的一段音频是音乐还是不行。只是布尔结果是好的,我并不需要知道密钥,BPM或类似的东西,我只是需要的,如果它似乎是音乐(相对于语音)才能够确定。编程语言无关,但我会最终将其转换到Python。 解决方案 在一个短语,傅立叶分析。看不同频率的随时间变化的功率。这里是讲话, ..
发布时间:2015-11-30 16:05:54 C/C++

其中的算法我应该使用信号(声音)一类分类?

更新这个问题是previously评为“举一个简单的算法,我的名字信号(音)模式检测” 我的目标是检测给定图案的presence在噪声信号。我想检测一个物种的昆虫的记录的声音用麦克风的presence。我已previously记录昆虫的声音以数字格式。 在我没有试图做语音识别。 我已经使用所述输入信号和所述图案之间的卷积来确定其相似性级别。但我认为,这种技术更适合离散时间(即数字通信,在信号发生 ..

比较两个spectogram找到抵消他们匹配算法

我记录从互联网每天2分钟无线电广播。总有相同的起始和结束的顺口溜。由于无线电广播确切的时间可能或多或少6分钟改变我必须记录大约15分钟广播。 我要确定确切的时间,其中的顺口溜是15分钟时限的记录,这样我就可以提取音频我想要的部分。 我已经开始了一个C#应用程序,我去code的MP3播放PCM数据和PCM数据转换为根据的 HTTP://www.$c$cproject.com/KB/audio-v ..
发布时间:2015-11-30 14:58:15 C#/.NET

两个音频序列之间的感知相似性

我想获得两块音频之间的某种距离度量的。例如,我要比较的动物到人类模仿动物的声音的声音,然后返回的声音多么相似的是一个分数。 这似乎是一个棘手的问题。什么是接近它的最佳方法是什么?我在想提取的音频信号的几个特点,然后做这些特征的欧氏距离或余弦相似性(或类似的东西)。什么样的功能,很容易提取和用于确定声音的感知差异? (我看到的东西上Ahazam如何使用散列,但这似乎是一个不同的问题,因为有两块音 ..
发布时间:2015-11-30 14:55:32 移动开发

为什么FFT产生复数而不是实数?

所有的FFT实现我们所遇到的结果在复值(与实部和虚部),即使输入到算法是一组离散的实数(整数)。的 这难道不是可能重新present频域的实数方面只? 解决方案 FFT是根本基础的变化。到其中的FFT改变你的原始信号的基础是一组正弦波代替。为了使这一基础来描述所有它需要能够重新present相位以及振幅的可能的输入;相位重新presented用复数。 例如,假设你FFT只包含一个正弦波信号 ..
发布时间:2015-11-30 14:45:26 C/C++

算法删除音轨声音

我想删除的MP3音轨的人声。我搜索谷歌,并尝试一些软件,但他们都不是有说服力的。我打算读取MP3文件,得到的波形和删除波形高于规定的限值。 你有没有对如何进行任何建议。 - 更新 我只想code,可读取MP3文件格式。是否有任何软件?? 解决方案 这是没有那么多的“算法”作为一个“绝招”,但它可能在code实现自动化。它的工作原理主要是为立体声音轨与那里的人声都集中。如果人声的中心,他们 ..
发布时间:2015-11-30 14:44:40 C/C++

数据音频和背部。调制/解调源$ C ​​$ C

我的二进制数据流,并希望将其转换为原始波形声音数据,我可以发送到扬声器。 这是老派的调制解调器做才能通过电话线(生产典型modemish音)来传输二进制数据是什么。它被称为调制。 然后,我需要一个相反的过程 - 从原始波形样本,我要得到确切的二进制数据。这就是所谓的解调 我发现一个特别的方式来做到这一点 - 频移键控。问题是我无法找到任何来源$ C ​​$ C。 您可以点我FSK任何语言的 ..
发布时间:2015-11-30 14:42:59 C/C++

算法,用于确定一个音频样本的关键

我感兴趣的是确定音频采样的音乐键。如何将(​​或可以)的算法去试图接近音乐的音频采样的关键? 安塔尔自整定和的Melodyne有两件软件,做这样的事情。 谁能给一个有点外行的解释,关于如何做到这一点的?要通过频谱的和弦进行分析等数学演绎一首歌曲的关键。 这个话题感兴趣了我很多! 修改 - 辉煌的来源和丰富的信息,可以找到从大家谁促成了这一问题 。 特别是从:the_mandrill和丹尼 ..
发布时间:2015-11-30 14:11:47 C/C++

将16位PCM到8位

我有存储在一个字节数组PCM音频。它是每个样本16位。我想让它每采样音频8位。 任何人都可以提出一个很好的算法来做到这一点? 我没有提到的比特率,因为我觉得它不是算法很重要 - 右 解决方案 我不明白现在为什么它是不够的,只是取上层字节,即舍弃低8位每个样品。 这当然假定样本是线性的;如果他们不那么也许你需要做一些事情下探位之前,线性他们。 短sixteenBit = 0xfeed; ..
发布时间:2015-11-30 14:09:05 Java开发

其中算法用于降噪的耳机?

我要编程软件降噪实时,同样的道理也发生在耳机与主动降噪。是否有任何公开的算法,或者至少,科学对此文件?谷歌搜索发现,关于唯一的非实时降噪信息。 href="http://www.best-headphone-review.com/bestnoisecancellingheadphones.html">本网站 主动降噪耳机之外的所有普通耳机的电路,有一个麦克风和额外的特殊电路。在基础层面上的 ..
发布时间:2015-11-30 13:58:06 C/C++

和弦检测算法?

我正在开发软件,取决于音乐的和弦检测。我知道有些算法基音检测,基于倒频谱分析或自相关技术,但它们主要集中在单声道材料识别。但我需要在同一时间用一些和弦识别工作,即多个球场,就像在一个和弦;没有人知道关于这个问题的一些很好的研究或解决方案? 我目前正在开发一些算法的基础上FFT,但如果任何人有一些算法或技术,我可以用一个想法,那将是很大的帮助。 解决方案 这是一个相当不错的开源项目: 有检测根 ..
发布时间:2015-11-30 13:55:58 C/C++

算法混合​​声音

我有我需要添加在一起的两个原始声音流。对于这个问题的目的,我们可以假设它们是相同的比特率和比特深度(说16位采样,44.1kHz的采样率)。 显然,如果我只是将它们添加在一起我会溢出和下溢我的16位空间。如果我加入他们在一起,除以2,然后每个体积减半,这是不正确的声波 - 如果两个人都讲在一个房间里,他们的声音不会成为一半安静,和一个麦克风可以拾取它们无论起来没有击中的限制。 那么什么是一起添 ..
发布时间:2015-11-30 13:46:34 C/C++

检测从原始波形数据特定的频率/音调

我读原始波流来自麦克风。 (这部分的工作,因为我可以将它发送到扬声器,并得到一个不错的回响。) 为了简单起见可以说,我要检测一个DTMF​​音的波形数据。在现实中,我想发现任何频率,而不仅仅是那些DTMF。但我总是知道哪个频率我找。 我曾尝试通过FFT运行它,但它似乎并不十分有效的,如果我想高精度的检测(说是有只有20毫秒)。我可以检测到它下降到大约200毫秒的精度。 我有哪些选择与问候算 ..
发布时间:2015-11-30 13:44:26 C#/.NET

什么是高通和低通滤波器?

图形和音频编辑和处理软件通常包含的功能被称为“高通滤波器”和“低通滤波器”。究竟是什么做这些做的,什么是算法实现它们? 解决方案 百科: 高通滤波器 低通滤波器 带通滤波器 这些“高”,“低”,以及“带”术语指的频率的。在高通,试图删除低频。在低通,您尝试删除高。在带通,你只允许一个连续的频率范围内保持不变。 选择截止频率取决于你的应用程序。编码这些过滤器既可以通过模拟RC电路或用傅立叶 ..
发布时间:2015-11-30 13:35:35 C/C++

鉴于音频流,发现当门抨击(声pressure水平计算?)

不是不像拍探测器(“拍拍上!拍手鼓掌的拍拍了!拍手鼓掌的拍拍上拍断,梆子!拍手鼓掌“)我需要检测一扇门关闭时。这是在车辆中,这比一个房间或家庭门更容易: 听:看: 这是采样的16位4kHz的,我想避免大量处理样品或储存。 当你看到它的大胆或另一种波形工具,这是相当独特的,而且几乎总是剪辑由于车辆的增加,声音pressure - 甚至在Windows和其他的门是打开的: 听:看: ..
发布时间:2015-11-30 13:34:04 C/C++

每分钟节拍从实时音频输入

我想编写一个简单的C#应用​​程序来监视线路的音频,给我的电流(好,滚动平均)每分钟心跳。 我见过的我知道必须吨,这个解决方案,因为大量的DJ软件,这样做,但我没有找到任何开源库或说明书上做自己运气好的话。 解决方案 计算一个powerspectrum用滑动窗口FFT: 以1024个样本: 双[]信号= stream.Take(1024); 其提供给一个FFT算法: 双[] =真 ..
发布时间:2015-11-30 13:30:42 C#/.NET