missing-data相关内容

删除日期少于完整观测值的日期

我有一个xts对象,该对象包含169天的高频率5分钟常规观测值,但是在某些日子中缺少观测值,即少于288个数据点.如何删除这些数据,以便只有几天的时间获得完整的数据点? 查找数据天 ddx = endpoints(dxts, on="days"); days = format(index(dxts)[ddx], "%Y-%m-%d"); for (day in days) { ..
发布时间:2020-05-09 23:20:33 其他开发

AMPL中的稀疏矩阵

我在AMPL中有一个稀疏矩阵.结果,它包含许多编码为“."的值.这 "." AMPL中的value表示“此处未指定值".当我尝试解决优化问题时,我收到一条包含“."的单元格,显示为“未为...指定任何值"的消息.因此,它无法解决问题. 但是,当我尝试指定默认值来替换“."时,问题不断增加,无法解决.有什么办法可以对参数设置限制,以使求解器不会查看“.".值? 希望这很清楚. 解决 ..
发布时间:2020-05-09 23:20:30 其他开发

使用ggplot在连续x轴上引入间隙

这有点像我以前的我要尝试的唯一方法是将缺少的月份视为零或不适用,在Sep的面积图中创建休克降幅或将其排除在外,但x轴的范围分别为1-11(请参见投寄箱资料夹). 我正在处理的数据集可以在我的投递箱文件夹中找到名为r_class.txt,您还可以看到两个不同的图(Rplots1和2). 任何想法都将不胜感激! 解决方案 将系列绘制为两个单独的数据框: #Load libra ..

数据帧中的NaN:当时间序列的首次观察为NaN时,先填充第一个可用的,否则继续进行上一个/先前的观察

我正在根据statsmodels执行ADF测试.该值系列可能缺少遗忘之处.实际上,如果NaN的分数大于c,我将放弃分析.但是,如果该系列解决了所有问题,则adfuller无法处理丢失的数据.由于这是具有最小帧大小的训练数据,因此我想这样做: 1)如果x(t = 0)= NaN,则找到下一个非NaN值(t> 0) 2)否则,如果x(t)= NaN,则x(t)= x(t-1) 因此,我在这 ..
发布时间:2020-05-09 23:20:17 Python

如果行式NA的比例低于某个阈值,如何用行方式替换NA?

为这个麻烦的问题道歉,但我目前正在从事心理健康研究.对于其中一种心理健康筛查工具,有15个变量,每个变量的值都可以为0-3.然后,将这15个变量的总和分配给每行/参与者的总分.该工具的文档指出,如果缺少特定行/参与者的值的20%以上,则总分也应视为缺失,但是,如果缺少某行的值的20%以上,则每个缺少的值应分配给该行的剩余值的平均值. 我决定要执行此操作,我将必须计算每个参与者的NA的比例,计 ..
发布时间:2020-05-09 23:20:12 其他开发

将缺少值的嵌套列表转换为R中的数据框

我有一个存储在列表中的googleway程序包输出的地理编码列表(ggmap地理编码无法使用API​​密钥),该列表的每个元素都包含两个列表.但是,对于找不到结果的地址,列表的结构是不同的,这使我将列表转换为数据框的尝试感到沮丧. (通过dput()创建)的“不丢失"结果的结构如下(忽略乱码,RStudio在控制台中无法正确显示西里尔字母): structure(list(result ..
发布时间:2020-05-09 23:20:07 其他开发

介于两者之间的缺失值的非缺失值的级数

继续上一个主题: 在缺失值之间查找非缺失值 我还要查找缺失值之前的值是否小于,等于或大于缺失值之后的值. 要使用之前的相同示例,请执行以下操作: df = structure(list(FirstYStage = c(NA, 3.2, 3.1, NA, NA, 2, 1, 3.2, 3.1, 1, 2, 5, 2, NA, NA, NA, NA, 2, 3.1, 1), Secon ..
发布时间:2020-05-09 23:20:04 其他开发

缺少完整列的VaR计算

我需要计算股票收益的滚动VaR.从这篇文章中:使用rollapply函数使用R进行VaR计算,我知道缺少完整情况的列将给出错误.但是由于各个公司的股票收益的开始日期和结束日期不同,因此当数据从长格式转换为宽格式时,它会产生缺失值.可以仅使用没有缺失值的行来进行估计,但这会导致严重的数据丢失.因此,有什么方法可以对具有完全缺失值的列进行计算,对于缺失列,则获得输出"NA".这就是我所做的: l ..
发布时间:2020-05-09 23:19:41 其他开发

PHP:写入文件时缺少记录

每次出现消息时,我的电信供应商都会向我发送报告.我编写了一个非常简单的PHP脚本,该脚本通过HTTP GET接收值.我使用fwrite将查询参数写入CSV文件.文件名是report.csv,当前日期为前缀. 这是代码: ..
发布时间:2020-05-09 23:19:32 PHP

使用线性近似法估算NA观测值的边界

我想使用以下两个非NA观测值的线性近似值,在阵列的开头为NA观测值插值,以推断缺失值.然后使用前面的两个非NA观测值对阵列末尾的NA观测值执行相同的操作. 我的df的可复制示例: M=matrix(sample(1:9,10*10,T),10);M[sample(1:length(M),0.5*length(M),F)]=NA;dimnames(M)=list(paste(rep("C ..
发布时间:2020-05-09 23:19:25 其他开发