time-series相关内容
我有一个这样的数据集,其中某些年份的数据丢失。 County Year Pop 12 1999 1.1 12 2001 1.2 13 1999 1.0 13 2000 1.1 我想要 County Year Pop 12 1999 1.1 12 2000 NaN 12 2001 1.2 13 1999 1.0 13
..
我在(Python)statsmodels库中的ccf()方法遇到了一些问题。等效操作在R中运行良好 ccf在我的示例中产生两个变量A和B之间的互相关函数。我有兴趣了解A在多大程度上是B的领先指标。 我正在使用以下内容: import pandas as pd import numpy as np import statsmodels.tsa.stattools as smt
..
什么是时序数据库,例如InfluxDB? 我应该在什么时候/在哪里使用它? 请给我它的商业场景的样本。 推荐答案 勾选wiki: 时间序列数据库(TSDB)是经过优化的软件系统 对于处理时间序列数据,按时间索引的数字数组(a 日期时间或日期时间范围)。在某些领域,这些时间序列是 称为轮廓、曲线或迹线。股票价格的时间序列 可以被称为价格曲线。能源消耗的时间序列 可能被称为负载配置文
..
我需要从月平均或年平均时间序列数据计算5年平均数据(不是滚动平均数据,而是日历年数据)。 在搜索了XARRAY文档之后,我找不到一种简单的方法来完成它。 有没有人有计算这类平均值的方法? 谢谢! 推荐答案 计算5年平均值的最简单方法是将自定义频率传递给resample(),例如 In [24]: ds = xr.Dataset({'x': ('time', np.arang
..
我有两个时间序列数据A和B。我想在R中执行以下线性回归 A~LAGS(A,1:2)+LAGS(B,1:2) 您能帮我弄一下R码吗? 推荐答案 使用Dyn和内置的BOD数据框(包含时间和需求两列),我们可以指定指示的滞后。 请注意,dplyr包存取器延迟,因此仅在加载它的情况下恢复基本延迟。请注意LAG所需的符号。 使用dyn$lm和Zoo(Bod)将导致自动对齐。
..
我有一些短时间序列(可能是30-100个时间点),它们有一个大致的形状:它们从高开始,快速下降,可能在零附近稳定,也可能不稳定在零附近,然后回升。如果它们不平坦,它们看起来就像简单的二次曲线,如果它们平坦,你可能会得到一长串的零。 我正在尝试使用lmfit模块来拟合一条连续的分段线性曲线。我想推断直线在哪里改变了渐变,也就是说,我想知道曲线在哪里“定性”地改变了渐变。一般说来,我想知道梯度何时停
..
我在DATA_SENSOR中有一个包含106个时序的列表。每个Tibble都有两列,分别包含日期和温度。 另一方面,我在DATE_ADMIN中有一个包含106个日期的列表,其中包含我希望时间序列以Tibble结束的日期。 代码运行正常,但使用嵌套的for循环会花费太多时间,因为平均行数接近每个Tibble的10000行。 library(tidyverse) library(dp
..
我有两个数据框要拼接在一起,左边的数据框有信息索引by(日期,ID),右边的数据框有信息索引by(Period,ID),周期是年-月。 结束时,我对左侧帧执行了GROUP BY ID,遍历各个组,在右侧帧上选择相同的组,然后对左侧数据框中组的索引执行AND ASF操作,如下所示: def merge_func(base_df, si_df): df_list = list(
..
我有一个名为allAR1的模型对象列表。对于每个模型对象,我需要使用tsdiag函数来生成诊断图,然后将该图保存到一个文件夹中。 我尝试使用jpeg()、lApply和dev.off()的组合将tsdiag应用到每个模型,然后将生成的绘图另存为图像文件。问题是,这似乎只保存了allAR1列表中第一个模型的诊断图,而我想要将所有模型的诊断图保存在allAR1中。 以下是我的代码和一个可重复使
..
val time 5.6 2021-11-18 03:00:00 2.034 2021-11-18 05:00:00 1.171 2021-11-18 07:00:00 3.023 2021-11-18 09:00:00 4.202 2021-11-18 16:00:00 1.202 2021-11-18 17:00:00 5.202 202
..
由于time变量(不平衡面板数据): ,我想合并不同长度的长格式数据帧: set.seed(63) #function to create a data frame that includes id, time and x func1
..
我在使用PIVOT_WIDER将数据帧转换为宽格式时遇到一些问题。我的数据帧如下所示: Data
..
我有均匀间隔的时间序列和每日平均观测数据。 如何以最简单的方式计算季节平均值?季节应遵循DJF(=冬季:12月、1月、2月)、MAM、JJA和SON的气象命名法。 这意味着12月份的值来自年份x-1。 月平均值的计算方法如下: How to calculate a monthly mean? 在计算季节平均值时,可以遵循这一思想。然而,有几个警告使它不太透明,必须小心!
..
我有一个包含时间戳-数据信号的数据文件。 我正在尝试检测信号的峰值以及峰值的开始和结束。 参考此post,我可以毫无问题地检测到峰值。 问题是如何稳健地检测峰值信号的开始/结束? 如何检测信号连续上升的开始,或连续下降趋势的结束? 我对数字信号处理非常陌生。欢迎提出任何建议。 推荐答案 我按照此matlab findpeaks链接定义峰值的开始和结束。
..
我正在分析时间序列数据,希望提取5个主要频率分量,并将其用作训练机器学习模型的特征。我的数据集是921 x 10080。每一行都是一个时间序列,总共有921个。 在探索可能的方法时,我遇到了各种函数,包括numpy.fft.fft、numpy.fft.fftfreq和DFT...我的问题是,这些函数对数据集做了什么?这些函数之间有什么区别? 对于Numpy.fft.fft,块文档状态:
..
继续下面提到的前面的查询 Regression with lagged time time series data in R 我的目标是提取回归模型的第四个有意义的系数,即p值<;0.05 模型的一般形式为 A ~ Lags(A, 1:2) + Lags(B, 1:2) 我有一个具有10列和24行的数据框Designments_2015Q2。在数据框Designme
..
我已经在Google CoLab中使用GPU调整了这段代码,以创建一个多层LSTM。它用于时间序列预测。 from keras.models import Sequential from keras.layers import Dense from keras.layers import LSTM import tensorflow as tf from tensorflow.keras.m
..
我使用了以下代码: 从statsmods.tsa.arima_model导入ARIMA model=ARIMA(ts_log,order=(2,1,0)) 出现此错误: 回溯(最近一次调用): 文件“”,第1行,位于 model=ARIMA(ts_log,order=(2,1,0)) 文件“C:UsersAprilAnaconda3libsite-packagesstat
..
下面是this recipe。我‘透视’了一个数据帧,如下所示: Close 2015-02-20 14:00:00 1200.1 2015-02-20 14:10:00 1199.8 2015-02-21 14:00:00 1199.3 2015-02-21 14:10:00 1199.0 2015-02-22 14:00:00 119
..
假设我有两个时间序列{x}和{y},并且想要检查{y}的当前实现如何依赖于{x}的当前实现和过去实现以及{y}的过去实现。为此,我可以运行包含{x}和{y}的p滞后的VAR(P)模型。然而,我想假设{x}是外生的,所以我想运行ARIMAX模型会更好,即具有一个或多个外生变量的ARIMA模型。 为了估计R中的ARIMAX模型,我可以使用TSA包中的函数arimax()(https://www.
..