librosa - IT屋-程序员软件开发技术分享社区

在librosa MFCC功能中使用了多少个MEL滤镜？

librosa.Feature.mfcc(y=NONE，sr=22050，S=NONE，n_mfcc=20，dct_type=2，Norm=‘Ortho’，Lifter=0，**kwargs) librosa MFCC函数不包含要为要使用的MEL滤镜数量传递的参数。有没有办法定义它，或者它是否使用librosa.filters.mel中使用的默认值‘’n_mes=128‘’。推荐答案 ..

发布时间：2022-08-09 11:52:45 speech-recognition librosa mfcc 其他开发

根据音色(音调)按相似度对声音进行排序

说明我希望能够根据声音的音色(音调)对列表中的声音集合进行排序。下面是一个玩具示例，其中我手动对我创建的12个声音文件和uploaded to this repo的频谱图进行了排序。我知道这些排序是正确的，因为为每个文件生成的声音与其前面文件中的声音完全相同，但添加了一种效果或过滤。例如，声音的正确排序x、y和z，其中 x和y发音相同，但y有失真效果 y和z发音相同，但z过 ..

发布时间：2022-03-28 15:32:21 python audio signal-processing numpy-ndarray librosa Python

Librosa基音跟踪-STFT

我正在使用this算法来检测 this音频文件。正如你所听到的，这是在吉他上演奏的E2音符，背景中有一点噪音。我使用STFT生成了此频谱图：我使用上面链接的算法，如下所示： y, sr = librosa.load(filename, sr=40000) pitches, magnitudes = librosa.core.piptrack(y=y, sr=sr, fmin= ..

发布时间：2022-03-28 15:00:44 python signal-processing pitch-tracking librosa Python

我将一些音频文件转换为频谱图并使用以下代码将它们保存到文件中: 导入操作系统从 matplotlib 导入 pyplot 作为 plt导入 librosa导入 librosa.display将 IPython.display 导入为 ipdaudio_fpath = "./audios/"spectrograms_path = "./spectrograms/"音频剪辑 = os.listdir ..

发布时间：2021-12-21 00:10:21 python audio signal-processing spectrogram librosa Python

我的 librosa MFCC 输出是否正确?我想我在使用 librosa MFCC 时得到了错误的帧数

result=librosa.feature.mfcc(信号，16000，n_mfcc=13，n_fft=2048，hop_length=400)结果.shape() 信号长 1 秒，采样率为 16000，我计算了 13 MFCC，跳长为 400.输出维度为 (13,41).为什么我得到41帧，不应该是(time*sr/hop_length)=40吗? 解决方案 TL;DR answer ..

发布时间：2021-12-20 23:55:52 python audio librosa audio-processing mfcc Python

如何使用上下文窗口来分割整个日志梅尔谱图(确保所有音频的段数相同)?

我有几个不同时长的音频.所以我不知道如何确保音频的段数 N 相同.我正在尝试实现现有的论文，因此据说首先通过使用 25 ms 汉明窗口和 10 ms 重叠，在整个音频中使用 64 个 Mel 滤波器组从 20 到 8000 Hz 执行对数梅尔谱图.然后，为了得到我有以下代码行: y, sr = librosa.load(audio_file, sr=None)#sr = 22050#len(y) ..

发布时间：2021-12-20 23:55:13 audio audio-processing spectrogram librosa windowing 其他开发

如何将 Librosa 光谱图保存为特定大小的图像?

所以我想将频谱图图像提供给卷积神经网络，以尝试对各种声音进行分类.我希望每个图像都是 384x128 像素.但是，当我实际保存图像时，它只有 297x98.这是我的代码: def save_spectrogram(num):dpi = 128x_pixels = 384y_pixels = 128样本，sr = load_wave(num)stft = np.absolute(librosa.s ..

发布时间：2021-12-20 23:31:02 python matplotlib audio librosa Python

python中谷歌语音识别的“音频数据必须是音频数据"错误

我正在尝试在 python 中加载音频文件并使用谷歌语音识别进行处理问题在于，与 C++ 不同，python 不显示数据类型、类，也不让您通过创建新对象和重新打包数据来访问内存以在一种数据类型和另一种数据类型之间进行转换我不明白如何在 python 中从一种数据类型转换为另一种数据类型有问题的代码如下，将speech_recognition导入为spr导入 libros ..

发布时间：2021-09-25 20:16:42 python windows speech-recognition google-speech-api librosa Python

如何使用 Python 将 scipy.signal.spectrogram 反转为音频?

我有: 导入 librosa从 scipy 导入信号将 scipy.io.wavfile 导入为 sf样本，sample_rate = sf.read(args.file)nperseg = int(sample_rate * 0.001 * 20)频率，时间，频谱图 = 信号.频谱图(样本，采样率，nperseg=nperseg,window=signal.hann(nperseg))音频信号 ..

发布时间：2021-07-16 21:07:40 python scipy spectrogram librosa Python

librosa 加载与 scipy.io.wavfile 读取的区别

我对librosa的load函数和scipy.io.wavfile的read函数的区别有疑问.> from scipy.io import wavfile导入 librosafs, data = wavfile.read(name)数据, fs = librosa.load(name) 导入的语音文件是同一个文件.如果运行上面的代码，两个函数出来的数据的值是不一样的.我想知道为什么数据的值不同 ..

发布时间：2021-07-16 20:51:15 python scipy librosa Python

“无后端错误"在 Python 中读取文件时

我正在尝试对一堆声音文件执行 STFT，但出现此错误.我尝试执行 STFT 的文件路径是正确的，但仍然出现此错误. 导入 librosa导入 io将 numpy 导入为 np将张量流导入为 tf导入操作系统导入全局path_te = "C:\Users\aanum\OneDrive\Documents\Deep Learning\timit-homework\te"文件 = os.listdir ..

发布时间：2021-06-28 18:58:08 python-3.6 librosa 其他开发

运行 librosa &树莓派 3 上的麻木

我正在尝试在我的 raspberry pi 3 上运行 librosa.经过几个小时的互联网搜索，我终于能够安装它，但是当我尝试导入它时仍然会引发错误.首先，我在安装依赖项 llvmlite 时遇到了问题.我最终使用以下代码安装了它:conda install -c numba llvmlite.我使用带有 miniconda 的 python 3.4 构建. 安装 llvmlite 后，我 ..

发布时间：2021-06-10 19:04:56 python raspbian raspberry-pi3 numba librosa Python

我想使用librosa读取多个音频文件，然后将其保存到一个空列表中

这里是我的代码.当我追加到数组中时，数组保持为空.请帮助我，错误在哪里.或告诉我其他方法也可以这样做 A = []#使用librosa加载更多文件pathAudio =“驱动器/我的驱动器/数据集/噪声/"文件= librosa.util.find_files(pathAudio，ext = ['wav'])文件= np.asarray(文件)对于文件中的y:数据sr = librosa.lo ..

发布时间：2021-05-31 18:47:10 python machine-learning librosa AI人工智能

ParameterError:音频缓冲区不是到处都是有限的

在Urban Sound数据集的一个声音文件上使用以下代码时， s，r = librosa.load(train_filename [7543])tonnetz = librosa.feature.tonnetz(y = librosa.effects.harmonic(s)，sr = r) 我收到以下警告和 ParameterError ， E:\ installed_python_ ..

发布时间：2021-05-31 18:40:20 python-3.x machine-learning librosa AI人工智能

通过pip安装librosa失败

Python版本是3.4.2 (env)ishandutta2007 @ MacBook-Pro:〜/Documents/Projects/my_proj $ pip install librosa 收集librosa收集joblib> = 0.12(来自librosa)使用已缓存 https://files.pythonhosted.org/packages/69/91/d217cec1f ..

发布时间：2021-05-30 19:38:57 python-3.x llvm librosa 其他开发

如何从Google Storage加载音频/如何从Google Storage读取音频

我以wav格式将音频文件保存在google存储中，但是当我尝试使用google colab加载音频时，却无法完成操作. 下面是我用来从Google存储设备加载音频的示例. 将numpy导入为np将IPython.display导入为ipd进口librosa将声音文件导入为SF导入io从google.cloud导入存储导入操作系统从google.colab导入身份验证auth.authent ..

发布时间：2021-05-12 19:59:18 python google-cloud-storage google-colaboratory librosa Python

获取与Librosa中的STFT相关的频率

在使用 librosa.stft()计算频谱图时，如何获取相关的频率值?我对像 librosa.display.specshow 中那样生成图像不感兴趣，但是我想掌握这些值. y，sr = librosa.load('../recordings/high_pitch.m4a')stft = librosa.stft(y，n_fft = 256，window = sig.windows.hamm ..

发布时间：2021-05-06 20:58:06 python signal-processing fft librosa dft Python

计算帧中的FFT并写入文件

我是python的新手，我正在尝试获取上载的wav文件的FFT值，并返回文本文件每行中每帧的FFT(使用GCP) 使用scipy或librosa 我需要的帧速率为30fps wave文件的采样率为48k 所以我的问题是如何将整个wav文件的样本划分为每一帧的样本如何添加空白样本以使帧样本的长度为2的幂(如48000/30 = 1600，添加448个空白样本以使其 ..

发布时间：2021-05-06 20:57:58 python scipy fft librosa Python

WAV文件的特征提取

我们正试图从.wav文件中提取功能，并始终出现相同的错误. 我们尝试使用python 3.6.6和3.7.4版本，但错误是相同的. import csv导入球导入操作系统进口librosa将numpy导入为np如果__name__ =='__main__':def extract_feature(文件名):x，sample_rate = librosa.load(文件名)stft = n ..

发布时间：2021-05-06 20:32:02 python wav feature-extraction librosa Python

cx_freeze不允许我使用librosa Python3制作gui

您好，noob python用户在这里，我正在尝试使用cx_freeze和librosa音频库制作可执行文件.但是，每次我尝试使用cx_freeze制作可执行文件并导入librosa库时，该可执行文件都不起作用.我可以帮忙吗?注意:主代码只是调试错误的示例脚本. 这是主要代码，它是示例代码，但导入librosa.我正在使用此代码来只是调试并输出相同的错误. 将PySimpleGUI导入 ..

发布时间：2021-04-27 20:46:35 python python-3.x cx-freeze librosa Python

librosa相关内容