从字符串中删除/替换特定单词或短语-R [英] remove/replace specific words or phrases from character strings - R

查看:30
本文介绍了从字符串中删除/替换特定单词或短语-R的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我环顾了一下这里和其他地方,发现了许多类似的问题,但没有一个能确切地回答我的问题。我需要清理命名约定,特别是替换/删除特定列/变量中的某些单词和短语,而不是整个数据集。我正在从SPSS迁移到R,下面我有一个在SPSS中执行此操作的代码示例,但我不确定如何在R中执行此操作。

EG:

"Acadia Parish"-->"Acadia"(删除Parish和Parish前的空格)

"第五区"-->"第五区"(移除区和区前空间)

SPSS语法:

COMPUTE county=REPLACE(county,' Parish','').

在包含32,000个大小写的列中,此问题只有几个实例,需要替换/删除的内容有所不同,并且大小写可以重复(包含‘Parish’的短语有几十个实例),这意味着编写需要删除/替换的内容要快得多,删除所有空格、特定单词或字符后面的所有字符、所有特殊字符等不像正则表达式那样简单或简洁。

并且必须包含前导空格。

我看过R中的place()gsub()和其他类似命令,但它们都涉及创建向量,或者说看起来它们确实涉及创建向量。我想要的语法是查找我指定的字符(可以包括前导空格或尾随空格),并用我指定的内容替换它们(可以什么也不包括),如果找不到特定字符,大小写不变。

是的,我最终会多次重复相同的语法,创建向量可能更容易,但如果可能的话,我希望获得我描述的语法,因为我还需要执行其他类似的操作。

谢谢您的关注。

推荐答案

dataframename$varname <- gsub(" Parish","", dataframename$varname)

这篇关于从字符串中删除/替换特定单词或短语-R的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆