spectrogram相关内容
我将一些音频文件转换为频谱图并使用以下代码将它们保存到文件中: 导入操作系统从 matplotlib 导入 pyplot 作为 plt导入 librosa导入 librosa.display将 IPython.display 导入为 ipdaudio_fpath = "./audios/"spectrograms_path = "./spectrograms/"音频剪辑 = os.listdir
..
我有几个不同时长的音频.所以我不知道如何确保音频的段数 N 相同.我正在尝试实现现有的论文,因此据说首先通过使用 25 ms 汉明窗口和 10 ms 重叠,在整个音频中使用 64 个 Mel 滤波器组从 20 到 8000 Hz 执行对数梅尔谱图.然后,为了得到我有以下代码行: y, sr = librosa.load(audio_file, sr=None)#sr = 22050#len(y)
..
我正在尝试绘制给定的时域信号的频谱图: N=5000;phi = (rand(1,N)-0.5)*pi;a = tan((0.5.*phi));i = 2.*a./(1-a.^2);情节(一);频谱图(i,100,1,100,1e3); 问题是我不明白参数和应该给出什么值.我使用的这些值,我参考了 MATLAB 的 spectrogram 在线文档.我是 MATLAB 的新手,我只是不明白.任
..
我在这个问题 我想得到同样的结果.但在我的情况下,它绘制了第一张图像 然后我得到一个错误 回溯(最近一次调用最后一次): 中的文件“c:/Users/Maram/Desktop/Spectrogram/first_attempt.py",第 73 行fftArray = fftArray[0:numUniquePoints]类型错误:切片索引必须是整数或无或具有 __index__ 方法
..
我有: 导入 librosa从 scipy 导入信号将 scipy.io.wavfile 导入为 sf样本,sample_rate = sf.read(args.file)nperseg = int(sample_rate * 0.001 * 20)频率,时间,频谱图 = 信号.频谱图(样本,采样率,nperseg=nperseg,window=signal.hann(nperseg))音频信号
..
我有一个用于音乐和语音分析的 PyQt 和 pyqtgraph 程序,我想绘制 wav 文件的频谱(使用 scipy python 包计算).我可以在 matplotlib 中完成,但由于 matplotlib 的性能,我需要切换到 pyqtgraph,但我找不到任何一致的方法将 scipy.signal.spectrogram 的输出绘制到 pyqtgraph 谢谢! 解决方案 S
..
x 是一个 numpy.float32 数组,值从 -200 到 0.这些是 dB(分贝)值. 当我这样做时(按照此处的建议): Image.fromarray(x, mode='F') 我得到一个灰度或有时接近黑色的图像. 如何将 [-200, 0] 中的浮点数映射到可以使用 Python 模块 PIL 读取的 24 位 RGB 字节数组(使用颜色图)和 Image.fromar
..
我正在尝试使用 matplotlib 绘制信号和信号的频谱图,但是...我仅获得信号的第一个值(样本)的频谱图(例如 30000 中的 60 个...). 这是一个非常长的文件,这就是为什么我只想绘制前30000个样本的原因. 这是代码: 将matplotlib.pyplot导入为plt将numpy导入为np将熊猫作为pd导入Data=pd.read_csv('MySignal.tx
..
我以前从未处理过音频信号,对信号处理知之甚少.不过,我需要使用 matplotlib 库中的 pyplot.specgram 函数来表示和音频信号.这是我的做法. 将matplotlib.pyplot导入为plt将 scipy.io.wavfile 导入为 wavfile速率,帧= wavfile.read("song.wav")plt.specgram(帧) 我得到的结果是下面这张漂亮的
..
我想从 wav 文件中获取频谱图,然后将其保存为 png,但我只需要图像的内容(而不是轴或其他任何内容).我遇到了这些问题 Matplotlib 图:删除轴、图例和空格 scipy:savefig不包含框架,轴,仅包含内容 我还阅读了 Matplotlib 文档但这似乎没有用,因此以上问题的答案已过时,或者我做错了事情,因为简单 plt.savefig('out.png',bbox_i
..
以下代码使用 scipy.signal.spectrogram 或 matplotlib.pyplot.specgram 生成频谱图. 然而,specgram 函数的颜色对比度相当低.有什么办法可以增加吗? 将 numpy 导入为 np从 scipy 导入信号导入matplotlib.pyplot作为plt# 生成数据fs = 10e3N = 5e4放大器 = 4 * np.sqrt(2)
..
我目前在VS2012中使用Metro应用.我有一个C#代码,它记录用户的声音并将其保存到wav文件(16位,44.1kHz,单声道)中.我已经将PCM处理为仅包含值介于-1和1之间的双数组数据,如下所示. 下一步,我想做的就是将FFT应用于双数组数据并将其转换为频谱图.我想知道是否有FFT算法采用双精度数组,最好不使用任何库. 我还想知道是否有任何方法可以使用Metro将数据(应用FF
..
我的问题如下: 我拥有一张光谱图所需的所有值( scipy.fftpack.fft ).我想在python中创建3D频谱图. 在MATLAB中,这是一个非常简单的任务,而在python中,这似乎要复杂得多.我尝试了mayavi,3D绘制matplotlib绘制,但我没有做到这一点. 谢谢 我的代码: 将numpy导入为np将熊猫作为pd导入将numpy导入为np从scip
..
我正在尝试将ffmpeg与gnuplot结合使用以绘制一些音频频谱,我正在关注 ffmpegdoc 链接. 现在我要问的是什么“破折号"-的意思是在 -f data 之后的这一行上,它应该是文件名:ffmpeg命令的最后一个元素应该是输出文件,但我没有名为的文件-在运行命令后的目录中. ffmpeg -y -i in.wav -ac 1 -filter:a aresample = 800
..
我在将图像编码到某个.wav文件的频谱中时遇到问题,因此结果看起来类似于: 或者如果您不想下载SOX,则可以使用以下程序来创建图像声波文件的频谱图. #!/usr/bin/env python#coding:utf-8“"“本作品已根据知识共享署名3.0未移植许可证获得许可.弗兰克·扎尔科夫(Frank Zalkow),2012-2013年“"导入numpy为np从matplotlib导入
..
我正在尝试使用librosa创建MFCC图,但是该图似乎并不十分详细.目标是将该MFCC频谱图呈现给神经网络.我正在测试的音频文件长约1秒,来自Google Speech Commands数据集.我的代码是: WINDOW_SIZE = 20NFFT = int(((WINDOW_SIZE/1000)* 16000)样本_ = librosa.load(f,sr = 16000)mfccs =
..
我正在阅读本文有关使用卷积神经网络进行环境噪声歧视的文章,并希望复制他们的结果.他们将WAV文件转换为对数比例的梅尔频谱图.你怎么做到这一点?我能够将WAV文件转换为梅尔频谱图 y,sr = librosa.load('audio/100263-2-0-117.wav',duration = 3)ps = librosa.feature.melspectrogram(y = y,sr = sr
..
我想操纵一个 seewave 音频频谱图,然后将其转换回一个 .wav 文件.一个简单的例子 library(tuneR)图书馆(seewave)数据(tico)#使用相位信息生成频谱图spec_tico =光谱(tico,plot = FALSE,complex = TRUE,norm = FALSE,dB = NULL)#操纵频谱图spec_tico_new =废料(spec_tico)#
..
在我的算法中,我创建了一个频谱图并对数据进行了处理: 导入scipy.signal作为信号数据= spio.loadmat(mat_file,squeeze_me = True)['records'] [:, i]数据=数据-np.mean(数据)数据=数据/np.max(np.abs(数据))频率,时间,Sxx = signal.spectrogram(数据,fs = 250000,windo
..
我有一个.wav文件,我将其加载,然后得到下一个频谱图,以dB为单位显示频谱 http://i.stack.imgur.com/22TjY.png 现在我想确切地知道这些值,因为我想与其他wav文件进行比较,以识别这4个值是否存在. http://i.stack.imgur.com/Jun25.png 生成图片的源(取自其他stackoverflow示例) ## so
..