如何使用tidyr将较长的字符串值分隔为两列 [英] How to seperate longer stringvalues with tidyr into two columns

查看:26
本文介绍了如何使用tidyr将较长的字符串值分隔为两列的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

当我尝试使用(长)字符串值分隔一列时:

df <- tbl_df(c("Indian | Londen", "Greek | Amsterdam", "Hamburger and BBQ | Paris du Nord"))
df <- separate(df, col = value, into = c("var1","var2"), sep = " | ")

我收到一条警告消息,指出三个位置的值太多,当我查看更改后的数据帧时,我没有得到所需的df

# A tibble: 3 × 2
       var1  var2
*     <chr> <chr>
1    Indian     |
2     Greek     |
3 Hamburger   and

它似乎在每个空白处都会分裂,有谁知道解决这个问题的方法吗?Var2应包含城市或区域名称,谢谢。

推荐答案

sep参数为字符时将其解释为正则表达式。因此您需要转义|,它是regex中的特殊字符(),模式|(空格或空格)与regex中的空格相同,这就是字符串被空格拆分的原因:

df <- separate(df, col = value, into = c("var1","var2"), sep = " \| ")

df
# A tibble: 3 × 2
#               var1          var2
#*             <chr>         <chr>
#1            Indian        Londen
#2             Greek     Amsterdam
#3 Hamburger and BBQ Paris du Nord

这篇关于如何使用tidyr将较长的字符串值分隔为两列的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆