missing-data相关内容

编写脚本以忽略在r中找不到的对象

我正在尝试在r中构造一个脚本,以强制它忽略找不到的对象。 我的脚本的简化版本如下 试用<;-sum(a,b,c,d,e) A-e是通过计算数据框中列的总和生成的数值向量。 我的问题是我想在多个不同的条件下使用相同的脚本(并且拥有比a-e多得多的对象)。对于这些情况中的一些,对象a-e中的一些可能不存在。因此,%r返回错误对象%d未找到。 为避免为每个条件生成唯一的 ..
发布时间:2022-09-02 15:47:33 其他开发

用R中的滚动平均值来归因于缺失值

我是R新手,正在解决一个问题。 我需要一个函数来根据给定大小的窗口中元素的平均值来计算向量中的缺失值。 但是,此窗口将移动,因为假设MyNA位于位置30,而我的窗口大小为10,则应计算x[20:40]的平均值。因此,对于每个找到的NA,窗口平均值将不同。 我一直在尝试: impute.to.window.mean ..
发布时间:2022-09-02 15:24:11 其他开发

从NumPy掩码数组创建Pandas DataFrame?

我正在尝试从NumPy掩码数组创建一个PandasDataFrame,我知道这是一个受支持的操作。以下是源数组的示例: a = ma.array([(1, 2.2), (42, 5.5)], dtype=[('a',int),('b',float)], mask=[(True,False),(False,True)]) 哪个输出为: ..
发布时间:2022-09-02 15:07:55 Python

使用skLearning IterativeImputer类为鼠标输入遗漏的值

我正在尝试学习如何实现MICE来输入我的数据集的缺失值。我听说过Fancyimpute的鼠标,但我也读到Sklearn的IterativeImputer类可以实现类似的结果。摘自SkLearning的文档: 我们实现IterativeImputer的灵感来自R MICE Package(链式方程的多元推算)[1],但是 与它的不同之处在于,它返回单个补偿而不是多个 推卸责任。但是,Itera ..
发布时间:2022-09-02 14:55:03 Python

使用来自库MICE()的输入数据集来拟合R中的多水平模型

我刚开始在R中打包mice,但我正在尝试计算popmis中的5个数据集,然后分别匹配lmer()模型with()和最后的pool()。 我认为mice()中的pool()函数不适用于lme4包中的lmer()调用,对吗? 如果是这样的话,有没有办法编写一个定制的函数,它的作用类似于我下面的案例pool()? library(mice) library(lme4) imp ..
发布时间:2022-09-02 14:36:07 其他开发

还有比 pandas 填充()更快的方法吗?

Pandasfillna()速度明显较慢,尤其是在数据帧中有大量丢失数据的情况下。 有没有比这更快的方法? (我知道如果我只删除包含Nas的一些行和/或列会有所帮助) 推荐答案 我尝试测试: np.random.seed(123) N = 60000 df = pd.DataFrame(np.random.choice(['a', None], size=(N, 20 ..
发布时间:2022-09-02 14:19:21 Python

R:将因素变量中的<;na>;替换为0

我正在使用R编程语言。我有一个既包含字符变量又包含数字变量的数据集--我正在尝试用&0&q;替换该数据中的所有NA和空值。对于连续变量,NA/Empty值应替换为数字0。对于系数变量,NA/Empty值应替换为系数0。 过去,我使用一个标准命令将所有NA替换为0(在下面的代码中,";df";表示包含数据的数据框): df[df == NA] ..
发布时间:2022-05-07 15:48:51 其他开发