resampling相关内容
我想知道weka.filters.supervised.instance.Resample和weka.filters.unsupervised.instance.Resample有什么区别? 在哪些情况下,我们应该分别使用它们? 推荐答案 监督和非监督重采样的文档都相同,但 监督重采样的文档有以下附加语句: 可以使过滤器保持子样本中的类分布, 或使班级分布偏向均匀分布。 监
..
我有一个类似于此的CSV文件 Date,Temp1,Temp2 23-Oct-09 01:00:00,21.1,22.3 23-Oct-09 04:00:00,22.3,23.8 23-Oct-09 07:00:00,21.4,21.3 23-Oct-09 10:00:00,21.5,21.6 23-Oct-09 13:00:00,22.3,23.8 23-Oct-09 16:0
..
我有一个以600 Hz采样的240个数据点的数组,代表400ms。我需要将此数据重新采样到512个数据点,采样频率为1024 Hz,代表500ms。我假设由于我从400ms的数据开始,最后的100ms将只需要用0填充。 是否有完成此任务的最佳方法? 推荐答案 如果要避免内插,则需要上采样到76.8kHz的采样率(即,在每个输入样本后插入1270s),低通过滤,然后进行抽取(每75
..
我对 Julia 很陌生,但我正在尝试一下,因为基准测试声称它比 Python 快得多. 我正在尝试使用 ["unixtime", "price", "amount"] 格式的一些股票报价数据 我设法加载数据并将 unixtime 转换为 Julia 中的日期,但现在我需要重新采样数据以使用 olhc(开盘价、最高价、最低价、收盘价)作为价格和金额的总和,用于Julia 的特定时间段(
..
我有 2 个具有相同列但不同日期时间索引的数据框.我想重新采样其中一个以使用另一个的索引,并在另一个索引中没有数据的任何日期从一个转发填充数据. 将 pandas 导入为 pd将 numpy 导入为 np从日期时间导入日期时间作为 dta_values = np.random.randn(4, 4)a_index = [dt(2012, 3, 16), dt(2012, 3, 19), dt(2
..
我正在用 panda 编写脚本,但我无法提取我想要的正确输出.这是问题: 我可以从 CSV 文件中读取这些数据.在这里你可以找到表结构 http://postimg.org/image/ie0od7ejr/ 我想要上表数据的这个输出 月 Demo1 Demo 22013 年 6 月 3 12013 年 7 月 2 2 在 Demo1 和 Demo2 列中,我想计算以 u 开头
..
我有一个数据帧 t_unit,它是 pd.read_csv() 函数的结果. 日期时间 B18_LR_T B18_B1_T2016 年 3 月 24 日 09:00 21.274 21.17924/03/2016 10:00 19.987 19.86824/03/2016 11:00 21.632 21.41724/03/2016 12:00 26.285 24.7792016 年 3 月 24
..
我有一个一维 numpy 数组,我想对其进行下采样.如果下采样栅格与数据不完全吻合,以下任何一种方法都可以接受: 重叠下采样间隔 将末尾剩余的任意数量的值转换为单独的下采样值 插值以适应光栅 基本上如果我有 1 2 6 2 1 我将采样率降低了 3 倍,以下所有情况都可以: 3 33 1.5 或者任何插值会给我这里. 我只是在寻找最快/最简单的方法来做到这一点.
..
我正在编写一些代码,以不同的速度播放 WAV 文件,以便波形变慢和降低音调,或者更快和更高音调.我目前正在使用简单的线性插值,如下所示: int newlength = (int)Math.Round(rawdata.Length * lengthMultiplier);浮动[]输出=新浮动[新长度];for (int i = 0; i
..
我有 X 个样本的 3d 点数组(想象一个球的轨迹). 现在,我想对这些点重新采样,以便我有一个包含 y 个样本位置的新数组. y 可以大于或小于 x,但不能小于 1.总是至少有 1 个样本. 算法如何将原始数组重新采样为新数组?谢谢! 解决方案 基本思想是将 X 点绘制在图形上.然后使用一些合理的插值函数在它们之间进行插值.您可以使用线性插值、二次 B 样条等.通常,除
..
重采样数组很容易,比如 a = numpy.array([1,2,3,4,5,6,7,8,9,10]) 具有整数重采样因子.例如,因子为 2 : b = a[::2] # [1 3 5 7 9] 但是使用非整数重采样因子,它不会那么容易工作: c = a[::1.5] # [1 2 3 4 5 6 7 8 9 10] =>不是需要的... 应该是(使用线性插值): [1 2.5 4
..
请原谅明显的错误 - 仍在学习过程中. 我正在尝试以 15 分钟的频率对我的数据绘制一个简单的时间序列图.这个想法是绘制每月平均值,从每小时重新采样数据开始 - 仅包括那些在间隔中至少有 1 个观察值的每小时平均值.日均值和月均值有后续条件. 只有当这个错误没有出现时,这才相对简单 - “[DatetimeIndex(['2016-01-01 05:00:00', '2016-01-0
..
我正在用熊猫编写脚本,但我无法提取我想要的正确输出.这是问题: 我可以从 CSV 文件中读取这些数据.在这里你可以找到表结构 http://postimg.org/image/ie0od7ejr/ 我想要上面表格数据的输出 月演示1演示22013 年 6 月 3 12013 年 7 月 2 2 在 Demo1 和 Demo2 列中,我想计算常规条目和以 u 开头的条目.六月共
..
我正在使用 griddata 对网格上的 numpy 二维数组重新采样. z.shape = (1000, 1000)x, y = np.arange(-5, 5, 0.01), np.arange(-5, 5, 0.01)newx, newy = np.arange(-2, 2, 0.1), np.arange(-2, 2, 0.1)griddata((x, y), z, (newx[None
..
我想我在下面的代码中遗漏了一些东西. from sklearn.model_selection import train_test_split从 imblearn.over_sampling 导入 SMOTE# 分成训练集和测试集# 测试计数向量化器X = df[['垃圾邮件']]y = df['值']X_train, X_test, y_train, y_test = train_test_s
..
我一直认为 set.seed() 只会让随机变量生成器(例如,rnorm)为任何特定的输入值集生成唯一的序列.> 然而,我想知道,为什么当我们设置 set.seed() 时,函数 sample() 不能正确地完成它的工作? 问题 具体来说,给定下面的例子,有没有一种方法可以在 rnorm 之前使用 set.seed 但samplesample,/code> 仍会从此 rnorm 生成
..
我有以下通用格式的数据,我想重新采样到 30 天时间序列窗口: 'customer_id','transaction_dt','product','price','units'1,2004-01-02,thing1,25,471,2004-01-17,thing2,150,82,2004-01-29,thing2,150,253,2017-07-15,thing3,55,173,2016-05-
..
我有一个关于pandas Dataframes 的重采样方法的问题.我有一个每天观察一次的 DataFrame: 将pandas导入为pd将 numpy 导入为 npdf = pd.DataFrame(np.random.randint(0,100,size=(366, 1)), columns=list('A'))df.index = pd.date_range(datetime.date(2
..
假设我们有一个 x,y 点列表: x = [0, 0, 0]y = [0, 10, 100] 点之间的欧几里得距离现在是 [10, 90]. 我正在寻找一个接受 x、y 和 sample_rate 并且可以输出相等距离点的函数.例如: x = [0, 0, 0]y = [0, 10, 100]resample_distance = 10重采样器(x,y,resample_distance)
..
我正在尝试将 WasapiLoopbackCapture 的输出从我的声卡 44100Hz, 16bit, 2 channel 波形重新采样为 16000Hz, 16bit, 1 channel 格式,以便以后在System.Net.Sockets.NetworkStream(我想将转换后的字节写入网络流) 但我什至不知道如何开始!我真的是信号处理的新手,我试过搜索教程,但我无法理解如何做到
..