resampling相关内容
我正在为不是DatetimeIndex而是整数数组甚至浮点数的数据框寻找与resample方法等效的大熊猫. 我知道在某些情况下(例如,此)重新采样方法可以很容易地用重新索引和内插代替,但在某些情况下(我认为)不能. 例如,如果我有 df = pd.DataFrame(np.random.randn(10,2)) withdates = df.set_index(pd.date_
..
Dataframe.resample()仅适用于时间序列数据.我找不到从非时间序列数据中获取第n行的方法.最好的方法是什么? 解决方案 我将使用iloc,它根据整数位置并遵循常规python语法获取行/列切片. df.iloc[::5, :]
..
说我有一个10,000 pt的矢量,我想截取仅100个以对数间隔的点的切片.我想要一个函数为索引提供整数值.这是一个简单的解决方案,只需使用+日志空间,然后消除重复项即可. def genLogSpace( array_size, num ): lspace = around(logspace(0,log10(array_size),num)).astype(uint64)
..
根据 scipy.signal.resample ,速度应根据输入的长度 : 如前所述,重采样使用FFT转换,如果输入采样的数量较大且质数较大,则转换速度可能非常慢,请参阅scipy.fftpack.fft. 但是我在相同输入下的计时时间(因子x14)非常不同,并且期望输出尺寸只有很小的变化: import numpy as np, time from scipy.signal
..
编辑:Paul在下面解决了这一问题.谢谢! 我正在尝试将3x3矩阵重采样(放大)为5x5,使用interpolate.interp2d或interpolate.RectBivariateSpline(或任何可行的方法)填充中间点. 如果有一个简单的现有函数可以执行此操作,则我想使用它,但尚未找到它.例如,一个功能如下: # upscale 2x2 to 4x4 matrixSma
..
很容易对 这样的数组进行重新采样 a = numpy.array([1,2,3,4,5,6,7,8,9,10]) 具有整数重采样因子.例如,系数为2: b = a[::2] # [1 3 5 7 9] 但是由于使用非整数的重采样因子,因此操作起来并不容易: c = a[::1.5] # [1 2 3 4 5 6 7 8 9 10] => not what i
..
我有一个信号不是等距采样的;进行进一步处理.我以为scipy.signal.resample可以做到,但我不了解它的行为. 信号在y中,对应的时间在x中. 预计将在yy进行重新采样,所有相应的时间在xx中.有人知道我做错了什么或如何实现我所需要的吗? 此代码不起作用:xx不是时间: import numpy as np from scipy import signal impor
..
我有一个一维的numpy数组,我想对其进行下采样.如果下采样栅格不能完全适合数据,则可以使用以下任何一种方法: 重叠下采样间隔 将结尾处剩余的任意数量的值转换为单独的下采样值 插值以适合栅格 如果有的话,基本上是 1 2 6 2 1 我将采样降低3倍,以下所有内容都可以: 3 3 3 1.5 或任何插值给我带来的效果. 我只是在寻找最快/最简单的方法.
..
我经常使用pd.Series.resample(),想知道是否有一种方法可以重新采样/插值月网格数据(时间,纬度,经度)以表示"MS"(每月开始).我了解此功能未在Panel中直接实现.有解决方法吗? 解决方案 您应该查看 xray 包.这是一个N维标签阵列包装,扩展了许多熊猫的重采样/分组功能.它是一个纯python软件包,因此易于安装,并包含一些非常实用的netCDF I/O实用程序.
..
我有一个看起来像这样的数据框: Trial Measurement Data 0 0 12 1 4 2 12 1 0 12 1 12 2
..
我需要将2D数据重新采样到常规网格中. 这是我的代码的样子: import matplotlib.mlab as ml import numpy as np y = np.zeros((512,115)) x = np.zeros((512,115)) # Just random data for this test: data = np.random.randn(512,115)
..
我有一个75 Hz的采样数组,我想以128 Hz的频率存储它们.如果它是64 Hz和128 Hz,这非常简单,那么我会将所有样本加倍.但是,如果采样率不是彼此的一小部分,正确的方法是什么? 解决方案 如果要避免过滤,则可以: 将信号作为一组连接的内插三次曲线处理 ,但是这一点与使用线性插值相同.如果不了解信号和用途的更多信息,就无法构造valid系数(而不会破坏信号精度),例如
..
我有2个数据框,列相同但日期时间索引不同。我想重新取样其中一个,以使用另一个的索引,并从另一个索引中的任何日期使用前一个填充数据,其中没有数据。 将pandas导入为pd 从日期时间导入日期时间导入numpy为np 为dt a_values = np.random.randn (4,4) a_index = [dt(2012,3,16),dt(2012,3,19),dt(201
..
在SO上有几个类似的问题,但没有一个真的有帮助。基本上我正在尝试调整一个简单的png图像,如下所示: http://media.spiralknights.com/wiki-images/3/3e/Equipment-Proto_Sword_icon.png (来自mmo Spiral Knights,版权所有Three Rings Entertainment) 我最初实现了一个在p
..
我使用Pandas来构造和处理Data。 我在这里有一个DataFrame,它的日期是索引,Id和比特率。 我想通过ID对数据进行分组,并重新采样,同时,对每个ID相对的时间,最后保持比特率分数。 例如,给出: df = pd.DataFrame( {'Id':['CODI126640013.ts' ,'CODI126622312.ts'], 'beginning_time
..
我有一个多索引数据帧,我想重新采样,将数据点的频率降低3倍(意味着每3行成为一个)。 This: 时间值 ID测量 ET001 0 0 2 1 0.15 3 2 0.3 4 3 0.45 3 4 0.6 3 5 0.75 2 6 0.9 3 ET002 0 0 2 1 0.16 5 2 0.32 4 3 0.45 3 4 0.6 3
..
我正在使用熊猫来构建和处理数据。这是我的DataFrame: 我想对时间序列数据进行重新采样,对于每个ID(命名为“3”),从开始到结束(begin_time / end_time)都有所有比特率分数。例如,对于第一行,我想要有所有秒,从2016-07-08 02:17:42到07-07-08 02:17:55,具有相同的比特率分数,当然同样的ID 。如下所示: 例如,给出:
..
我将多个时间表的电子表格读入大熊猫数据帧,并将它们与普通的熊猫日期时间索引连接起来。记录时间序列的数据记录器不是100%准确的,这使得重采样非常烦人,因为如果时间稍微高于或低于采样间隔,它将创建NaN并开始使我的系列看起来像一条虚线。这是我的代码 def loaddata(filepaths): t1 = time.clock() for i在范围(LEN(文件路径)): XL =
..
我希望将以下 类型对象转换为大熊猫DataFrame对象( )。然而,我在大熊猫文档中找不到相关的功能,让我这样做。 数据采用以下格式: M30 日期 2016-02-29 -61.187699 2016-03-
..
我使用libswresample从任何PCM格式44.1,16位INT重新采样,立体声。 我是用所产生的音频流的一些音频音量分析玩弄,我想通了,万一我有44.1kHz的,16位INT单为源,我也大致表现公式: leftSample = sourceSample /开方(2); rightSample = sourceSample / SQRT(2); 但我期待: leftSample =
..