如何找出一段音频在另一段音频中开始和结束的时间? [英] How to find what time a part of audio starts and ends in another audio?

查看:31
本文介绍了如何找出一段音频在另一段音频中开始和结束的时间?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我有两个音频文件,其中一个句子由两个不同的人朗读(就像唱一首歌一样)。所以它们有不同的长度。他们只是发声,里面没有乐器。

A1:音频文件1
A2:音频文件2
例句:"Lorem ipsum door sit amet,."

我知道每个单词以A1开头和结尾的时间。我需要自动找出A2中每个单词的开始和结束时间。(任何语言,最好是Python或C#)

时间以XML格式保存。所以,我可以按单词拆分a1文件。那么,如何在不同时长、不同声音的另一个音频中找到一个词的声音呢?

推荐答案

因此,根据我所读到的内容,您似乎希望使用Dynamic Time Warping (DTW)。当然,我会留给维基百科来解释,但它通常用于识别语音模式,而不会从不同的发音中获得噪音。

遗憾的是,我更精通C、Java和Python。所以我会推荐Python库。

  1. fastdtw
  2. pydtw
  3. mlpy
  4. rpy2

通过rpy2,您可以实际使用R的库,并在您的python代码中使用它们的DTW实现。遗憾的是,我找不到任何好的教程,但如果您选择使用R,有一些很好的示例。

如果没用,请告诉我,干杯!

这篇关于如何找出一段音频在另一段音频中开始和结束的时间?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆