dataframe相关内容

遍历R中的所有行,删除符合条件的行

R数据框。它大约有十几列和150行左右。在以下两种情况下,我希望遍历每一行并将其删除 第8列的值未定义 第8列中其上一行的值已定义。 我的代码看起来是这样的,但它总是崩溃。这一定是个愚蠢的错误,但我想不出来。 for (i in 2:nrow(newfile)){ if (is.na(newfile[i,8]) && !is.na(newfile[(i-1),8]){ ..
发布时间:2022-06-29 15:00:58 其他开发

pandas 丢弃了副本,并用副本的纳米平均值替换了值

我有一个通过追加4个数据帧创建的数据帧(index=date)。正因为如此,我的索引中有重复项,通常同一天有3个nans和1个值。 我的目标是将此数据帧上采样到每天的频率(df = df.resample('1D)),但在此之前,我必须删除重复项。 我想删除重复的时间,但根据两个条件: 对于同一天,如果我们至少有1个值,则计算这些值的纳平均值,然后丢弃其余的。 同一天,如果我们只有N ..
发布时间:2022-06-27 13:31:06 Python

在 pandas 数据帧上使用isull()和groupby()

假设我有一个包含列‘A’、‘B’、‘C’的DataFrame DF。 我想计算‘B’列中按‘A’分组的NULL值的数量,并根据它创建一个词典: 尝试以下操作失败: df.groupby('A')['B'].isnull().sum().to_dict() 如有任何帮助,将不胜感激。 推荐答案 安装 df = pd.DataFrame(dict(A=[1, 2] * 3 ..
发布时间:2022-06-27 13:14:57 Python

基于列名对PANDA数据框中的列进行排序

我有一个有200多列的dataframe。问题是,在生成订单时,订单是 ['Q1.3','Q6.1','Q1.2','Q1.1',......] 我需要按如下方式对列进行排序: ['Q1.1','Q1.2','Q1.3',.....'Q6.1',......] 有什么方法可以在Python中完成此操作吗? 推荐答案 df = df.reindex(sorted(df.c ..
发布时间:2022-06-20 22:36:49 Python

如何使用递归记录父子层次结构中的所有路由?

我正在尝试浏览分层数据帧,并将每条可能的路由记录到另一个数据帧中。这些路线的深度可以可变。 原始数据帧(DF)。最高列表示父列中的值不是任何: 的子值 父级 子项 最高 a b 1 b c 0 b d 0 d e 0 最终目标数据帧: 级别3 级别2 级别1 级别0 a b c a b d e 这就是我目前拥有的 def search(parent ..
发布时间:2022-06-20 17:33:08 Python

在一个数据帧上使用Apply来填充另一个数据帧中缺少的值

首先,我想说我对R是个新手。这个问题令人沮丧,简直令人难以置信。我试过申请、申请和申请。所有这些都有错误。我迷路了。 我要做的是,如果记录没有时间(其中为NA),则从“结果”中提取时间,并将其放入“记录”中的时间中。 我已经在传统的for循环中做到了这一点,但它使代码难以阅读。我已经阅读了应用函数可以让这变得更容易。 Data Frame "Results" ID Time(se ..
发布时间:2022-06-20 15:21:18 其他开发

R列检查是否包含来自另一列的值

在R中有没有办法检查一列中的值是否包含另一列中的值?在下面的示例中,我试图查看col2中的值是否包含在col1中的值中(独立于每一行),但收到一条警告消息:“参数‘Pattern’的长度>1,将只使用第一个元素”。标志栏第一行/最后一行应显示“是”,第二行和第三行应显示“否”。如有任何关于如何解决的想法,我们将不胜感激。 col1 ..
发布时间:2022-06-10 22:51:09 其他开发

在R中使用Apply或MAP函数时,如何将列名传递给函数?

我正在尝试将多个函数应用于同一个DataFrame,但我无法成功地将列名作为参数传递,该参数使用purrr::imap。但是,我一直收到以下错误: UseMethod(&QOOT;SELECT&QOOT;)中出错:没有适用于‘SELECT’的方法 应用于类&Character&Quot;的对象 我尝试了在SO上找到的所有组合(例如,使用!!!、[[、enquo、sys.lang等等)。当我 ..
发布时间:2022-06-09 14:27:25 其他开发