如何删除数据帧中包含R中某些单词的行? [英] How to remove rows in a dataframe that contain certain words in R?

查看:15
本文介绍了如何删除数据帧中包含R中某些单词的行?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在尝试删除数据帧中包含特定单词或特定单词序列的行。例如:

mydf <- as.data.frame(read.xlsx("C:\data.xlsx, 1, header=T"))
head(df)
#     NO    ARTICLE    
# 1   34    New York Times reports blabla
# 2   42    Financial Times reports blabla
# 3   21    Greenwire reports blabla
# 4    3    New York Times reports blabla
# 5   46    Newswire reports blabla

我想从data.frame中删除包含字符串"New York Times"和"Newswire"的行。我尝试了使用%in%grep的不同方法,但我不太确定如何使用!

我该怎么做?

推荐答案

根据我的评论,使用grepl,它在向量中找到指定字符串时返回一个逻辑值。在您的情况下,如下所示:

df[!grepl('New York Times',df$Article),]

应该能起作用。

这篇关于如何删除数据帧中包含R中某些单词的行?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆