用相邻行而不是列中的值替换行中的NA [英] Replace NA in row with value in adjacent row "ROW" not column

查看:5
本文介绍了用相邻行而不是列中的值替换行中的NA的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

原始数据:

    V1 V2
1   c1  a
2   c2  b
3 <NA>  c
4 <NA>  d
5   c3  e
6 <NA>  f
7   c4  g

可重复的样本数据

V1 = c('c1','c2',NA,NA,'c3',NA,'c4')
V2 = c('a','b','c','d','e','f','g')

data.frame(V1,V2)

预期产量

  V1_after V2_after
1       c1        a
2       c2    b c d
3       c3      e f
4       c4        g
V1_after <- c('c1','c2','c3','c4')
V2_after <- c('a',paste('b','c','d'),paste('e','f'),'g')

data.frame(V1_after,V2_after)

这是示例数据。 在Real Data中,V1中NA不规则的行

对我来说太难了

推荐答案

您可以使用zoo::na.locf来执行此操作。它获取最新的非NA值,并填充途中的所有NA值:

library(dplyr)
library(zoo)

df %>%
  mutate(V1 = zoo::na.locf(V1)) %>%
  group_by(V1) %>%
  summarise(V2 = paste0(V2, collapse = " "))

# A tibble: 4 x 2
  V1    V2   
  <chr> <chr>
1 c1    a    
2 c2    b c d
3 c3    e f  
4 c4    g 

这篇关于用相邻行而不是列中的值替换行中的NA的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆