在 R 中使用 grep 查找作为整个单词的字符串(但不是作为单词的一部分的字符串) [英] Using grep in R to find strings as whole words (but not strings as part of words)

查看:19
本文介绍了在 R 中使用 grep 查找作为整个单词的字符串(但不是作为单词的一部分的字符串)的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在寻找正确的正则表达式.以下

I'm searching for the right regular expression. The following

t1 = c("IGF2, IGF2AS, INS, TH", "TH", "THZH", "ZGTH")
grep("TH",t1, value=T)

返回t1的所有元素,但只有第一个和第二个是正确的.我只想返回带有单词/短语 TH 的条目?

returns all elements of t1, but only the first and second are correct. I just want entries with word/phrase TH returned?

推荐答案

需要添加词边界锚 () 围绕您的搜索字符串,因此只会匹配整个单词(即被非单词字符或字符串开头/结尾包围的单词,其中单词字符"表示 w,即字母数字字符).

You need to add word boundary anchors () around your search strings so only entire words will be matched (i. e. words surrounded by non-word characters or start/end of string, where "word character" means w, i.e. alphanumeric character).

试试

grep("\bTH\b",t3, value=T)

这篇关于在 R 中使用 grep 查找作为整个单词的字符串(但不是作为单词的一部分的字符串)的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆