r相关内容

查找与模式匹配的所有文件名

我正在尝试找到一种方法来列出与此模式匹配的文件夹中的所有文件名: 20131106XXXXX.pdf 前缀是日期,XXXX的内容和长度因文件而异,我只关心pdf文件. 任何人都可以建议一种方法来做到这一点? 解决方案 试试这个 list.files(path="./yourdir",pattern="[[:digit:]]{8}.*\\.pdf") ..
发布时间:2021-07-06 20:23:19 其他开发

从字符串末尾删除句点

我有一些值,其中有些值最后有一个句点 (.),这里是 95.2.和 87.5.: c(“25.3"、“95.4"、“95.6"、“95.2."、“87.5.") 如何删除尾随句点?预期结果: c(25.3, 95.4, 95.6, 95.2, 87.5) 解决方案 我们可以使用 sub 来匹配点 (. - 是表示任何字符的元字符 - 所以我们要么转义 (\\.) 或将其放 ..
发布时间:2021-07-06 20:22:37 其他开发

字边界结束和边缘之间的正则表达式差异

正则表达式 说 符号\ 分别匹配在一个词的开头和结尾.符号 \b 匹配空字符串一个字的边缘 (一个词的)结束和边缘有什么区别? 解决方案 \b 和 \ 的区别code> 是 \b 可用于 PCRE 正则表达式模式(当您指定 perl=TRUE 时)和 ICU 正则表达式模式(stringr 包). >s = "无处无处">sub("\\", "", s)[1 ..
发布时间:2021-07-06 20:20:47 其他开发

包含美国货币的正则表达式/grep 字符串

我有一个字符串列表,其中一些包含美元数字.例如: '$34232 foo \n bar' 是否有一个 [r] 命令可以只返回包含美元金额的字符串? 谢谢! 解决方案 使用 \\$ 来保护 $ 否则意味着“字符串结束": grep("\\$[0-9]+",c("123","$567","abc $57","$abc"),value=TRUE) 这将选择包含美元符号后跟一个或多 ..
发布时间:2021-07-06 20:20:10 其他开发

在第一个和最后一个逗号上拆分字符串

我想在第一个和最后一个逗号上拆分字符串.每个字符串至少有两个逗号.下面是一个示例数据集和所需的结果. 这里有一个类似的问题询问如何在第一个逗号上拆分:在第一个逗号上拆分在字符串中 这里我问了如何在前两个冒号上拆分字符串:首先拆分字符串两个冒号 感谢您的任何建议.我更喜欢基本 R 中的解决方案.抱歉,如果这是重复的. my.data 解决方案 这里有一个比较简单的方法.在第 ..
发布时间:2021-07-06 20:19:29 其他开发

R提取第n个和第i个分隔符实例之间的字符串

我有一个字符串向量,类似于这个,但有更多的元素: s [1] "90.67.0" "90.0" "6.0" "2" "24.4.0" "274.46.0" 或者如果 n = 4 且 i = 5" [1] "1541" "151" "A2" "A" "A" "A266" 有什么建议吗?感谢您的帮助! 解决方案 #FUNCTIONfoo = 函数(x,n,i){do.call(c, l ..
发布时间:2021-07-06 20:18:35 其他开发

使用模式进行部分字符串匹配

我需要在 R 中编写一个查询来匹配列名中的部分字符串.我正在寻找类似于 SQL 中的 LIKE 运算符的东西.例如,如果我知道字符串的开头、中间或结尾部分,我会以以下格式编写查询: LIKE 'beginning%middle%' 在 SQL 中,它将返回匹配的字符串.在 pmatch 或 grep 中,我似乎只能指定 'beginning' 、 'end' 而不是顺序.我正在寻找的 R 中是 ..
发布时间:2021-07-06 20:18:19 其他开发

R:查找并删除所有一到两个字母的单词

我正在尝试从文本段落中清除任何一个或两个字母的单词.这是我的第一个想法 gsub(" [a-zA-Z]{1,2} ", " ", "a ab abc B BB BBB")[1]“aaaa BB BBBB" 我可以看到“a"是如何不被替换的,因为它没有以空格开头,我可以看到“BB"是如何不被替换的,因为它所引导的空格已经被“B"占据了. 解决方案 你可以利用\b 词边界和[[:alpha ..
发布时间:2021-07-06 20:17:05 其他开发

在 R 中形成和使用正则表达式

我是 R 的新手.我正在学习形成正则表达式的概念. 即类似这样的"(\\2.\\3)".这些是什么?我的意思是,这些数字和符号代表什么?谁能用非常外行的语言解释一下这是什么意思?或者类似这样的,(\2.\4)(\2.\4),是什么意思?感谢您的帮助! 解决方案 它们被称为 backreferences 回忆捕获组匹配的内容.捕获组可以通过将要分组的字符放在一组括号内来创建( ).反向 ..
发布时间:2021-07-06 20:16:56 其他开发

是否有等效的“&"?在 R 的正则表达式中用于反向引用整个匹配?

当我使用 vim 时,我经常使用 & 在替换中反向引用整个匹配项.例如,以下将所有“foo"的实例替换为“foobar": %s/foo/&bar/g 这里的好处是懒惰:我不必在匹配中键入括号,我只需要键入一个字符而不是两个字符作为替换中的反向引用.也许更重要的是,我在打字时没有弄清楚我的反向反射,从而减少了认知负担. 在 R 的正则表达式中是否有与我在 vim 中使用的 & 等效的代码 ..
发布时间:2021-07-06 20:15:13 其他开发

如何在特定字符串后提取所有内容?

我想提取 R 中字符串向量中“-"之后的所有内容. 例如: test = c("Pierre-Pomme","Jean-Poire","Michel-Fraise") 我想得到 c("Pomme","Poire","Fraise") 谢谢! 解决方案 With str_extract.\\b 是匹配字边界的零长度标记.这包括任何非单词字符: 库(stringr)str_ex ..
发布时间:2021-07-06 20:14:50 其他开发

基于正则表达式模式从向量中排除元素

我有一些数据要使用 R 中的正则表达式进行清理. 很容易找到如何获取包含某些模式或不包含某些单词(字符串)的元素,但我不知道如何排除包含模式的单元格. 如何使用通用函数来只保留那些不包含PATTERN的矢量元素? 我不想举个例子,因为这可能会导致人们使用其他(虽然通常很好)的方式来回答而不是预期的方式:基于正则表达式排除.无论如何,这里是: 如何排除包含以下任何字符的所有元 ..
发布时间:2021-07-06 20:14:38 其他开发

使用 R 查找字符串中的重复模式

我有一个包含表达式的大文本,例如:"aaaahahahahaha that was a good chance". 处理后,我希望 "aaaaahahahaha" 消失,或者至少,将其更改为简单的 "ha". 目前,我正在使用这个: gsub('(.+?)\\1', '', str) 当带有模式的字符串位于句子的开头时,此方法有效,但不包括 where 位于其他任何地方.所以: str ..
发布时间:2021-07-06 20:13:18 其他开发

正则表达式匹配不是 4 位数字的所有内容

我匹配并替换前后为空格的 4 位数字: str12 但是,每次尝试反转它并提取数字都会失败.我要: [1] 1234 有人知道吗? ps:我知道如何用 {stringr} 做到这一点,但我想知道是否可以只用 {base} .. require(stringr)gsub("\\s", "", str_extract(str12, "\\s\\d{4}\\s"))[1] 《1234》 ..
发布时间:2021-07-06 20:13:00 其他开发

如何将字符串向量转换为标题大小写

我有一个小写的字符串向量.我想将它们更改为标题大小写,这意味着每个单词的第一个字母都将大写.我已经设法用双循环来做到这一点,但我希望有一种更有效、更优雅的方式来做到这一点,也许是带有 gsub 和正则表达式的单行. 以下是一些示例数据,以及有效的双循环,然后是我尝试过但无效的其他操作. strings = c("第一个短语", "另一个要转换的短语",“这是另一个",“最后一个")# 对于 ..
发布时间:2021-07-06 20:12:35 其他开发

正则表达式:如何从最后一个括号中提取文本

从下面的字符串中提取字符串“(procedure)" - 或括号内的一般文本 - 的正确正则表达式是什么 输入字符串示例是 使用 flutemetamol (18F) 的正电子发射断层扫描与计算脑断层扫描(程序) 另一个例子 尿路感染预防(程序) 可能的方法是: 转到文本末尾,查找第一个左括号并从该位置取子集到文本末尾 从文本的开头,确定最后一个 '(' ..
发布时间:2021-07-06 20:10:22 其他开发