grepl - IT屋-程序员软件开发技术分享社区

使用grepl从跨多列的文本中提取值

我有一个数据帧(Df)，其中包含州和城市的2列数据。但是，有时两列中的数据会被调换或输入错误。数据帧将如下所示： location state Bangkok Bangkok Metropolitan Central Thai Bangkok 我想创建一个新列“City”，将这两个列中的“曼谷”提取到一个单独的列中。我可以 ..

发布时间：2022-09-03 16:34:29 r if-statement plyr grepl 其他开发

R-测试字符串向量是否包含另一个列表的任何元素

我有： > lst_A DT_result DT_result DT_result lst_B res ..

发布时间：2022-06-10 23:08:24 r string data.table grepl contain 其他开发

R列检查是否包含来自另一列的值

在R中有没有办法检查一列中的值是否包含另一列中的值？在下面的示例中，我试图查看col2中的值是否包含在col1中的值中(独立于每一行)，但收到一条警告消息：“参数‘Pattern’的长度>1，将只使用第一个元素”。标志栏第一行/最后一行应显示“是”，第二行和第三行应显示“否”。如有任何关于如何解决的想法，我们将不胜感激。 col1 ..

发布时间：2022-06-10 22:51:09 r dataframe contains grepl 其他开发

基于多列中的直接和间接相似性对变量进行分组的快速方法

我有一个相对较大的数据集(1,750,000 行，5 列)，其中包含具有唯一 ID 值的记录(第一列)，由四个标准(其他 4 列)描述.一个小例子是: # 示例库(数据表)dt ..

发布时间：2022-01-13 19:13:47 r loops optimization data.table grepl 其他开发

有没有办法使用类似的东西 filter(df, grepl("A|B|C",location)) 对于 dplyr SQL 表?在 SQL 中，它可能是 LIKE.当然，我可以将 SQL 表转换为 R 数据表，但它非常大.(http://cran.r-project.org/web/packages/dplyr/vignettes/databases.html) 目前我得到 sqliteSe ..

发布时间：2021-12-23 15:58:26 r filter dplyr grepl 其他开发

结合 grepl 过滤 dplyr 中的观察结果

我正在尝试研究如何使用 dplyr 和 grepl 从大型数据集中过滤一些观察结果.如果其他解决方案更佳，我不喜欢 grepl. 以这个示例df: df1 我想: 过滤掉那些以'x'开头的情况过滤掉以“xx"结尾的情况我已经设法摆脱所有包含“x"或“xx"但不以开头或结尾的内容.以下是如何摆脱内部包含 'xx' 的所有内容(不仅仅是结尾): df1 %>% filt ..

发布时间：2021-12-23 12:33:44 r filter dplyr grepl 其他开发

R - 如果向量中的任何字符串出现在几列中的任何列中，则返回布尔值

我有一个大数据框，其中每一行都代表入院.每次入院时在第 5 至 24 列中最多附有 20 个诊断代码. Col1 Col2 Col3 Col4 Diag_1 Diag_2 Diag_3 ... Diag_20数据数据数据数据J123 F456 H789 E468数据数据数据数据 T452 NA NA NA 另外，我有一个长度为 136 的向量 (risk_codes)，所有字符串.这些字符串 ..

发布时间：2021-11-16 23:21:02 r string dataframe apply grepl 其他开发

R:提取和粘贴关键字匹配

我是 R 的新手，一直在努力解决这个问题.我想创建一个新列，检查“text"列中是否存在一组单词(“foo"、“x"、“y")，然后将该值写入新列. 我有一个如下所示的数据框:a-> id 文本时间用户名1 “你好 x" 10 “我"2 “foo 和 y" 5 “你"3 “无" 15 “大家"4 "x,y,foo" 0 "知道" 正确的输出应该是: a2 -> id tex ..

发布时间：2021-11-16 23:18:29 r apply text-mining grepl 其他开发

如何计算列中的值并将它们与特定行匹配?

我有一个看起来像这样的数据集，其中 ID 和电子邮件对应于一个唯一的人.其余列代表由该人/行命名的人.例如，ID 为 1 且电子邮件地址为 alex@gmail.com 的人在被问到问题时名为 Pete、Jane 和 Tim. id 电子邮件 john_b alex_a pete jane tim1 alex@gmail.com 不适用不适用 1 1 12 pete@yahoo.com 不适用 ..

发布时间：2021-09-07 19:32:33 r tidyverse tidyr case-when grepl 其他开发

从每小时中提取/子集分钟值

我的数据框包含格式为 YYYY-MM-DD HH-MM-SS 的日期值，跨越 125000 多行，按分钟细分(每行代表一分钟).> 1 2018-01-01 00:04:002 2018-01-01 00:05:003 2018-01-01 00:06:004 2018-01-01 00:07:005 2018-01-01 00:08:006 2018-01-01 00:09:00...1249 ..

发布时间：2021-09-01 18:34:22 r subset grepl 其他开发

将前面和后面的单词连接到与 R 中的条件匹配的单词

我需要连接一个条件满足词的前后词.具体来说，那些匹配有逗号的条件. vector ..

发布时间：2021-08-31 18:46:54 r regex stringr grepl 其他开发

stringer 和 grepl 和 grep 中的 str_detect 函数有什么区别?

我开始在我的工作中进行大量的字符串匹配，我很好奇这三个函数之间的区别是什么，以及在什么情况下有人会使用一个而不是另一个. 解决方案 stringr 是“一组一致、简单且易于使用的围绕奇妙的 'stringi' 包的包装器".(来自包描述).与基本的 R 相比，stringi 的主要优点是包速度惊人.函数的输出在 base 中与 stringr 中相同. 我使用 stringi 生成一 ..

发布时间：2021-08-31 18:46:33 r stringr grepl 其他开发

在字符串列表中查找单词

我有 words 如果我使用 sapply(words, grepl, text) 给你 TRUE 和 FALSE 的答案，相反，我如何获得匹配的确切单词所以答案是 “这是word1" 我是 R 新手，请原谅我提出这样愚蠢的问题.欢迎提出任何想法. 解决方案一种选择是创建词边界，然后使用 grep 来避免任何字符串的部分匹配和 value =TRUE，它返回字符串而不是索引 ..

发布时间：2021-07-14 20:09:57 r regex sapply grepl 其他开发

使用正则表达式将 URL 提取到新的数据框列中

我想使用正则表达式将数据框中文本中的所有 URL 提取到新列中.我有一些用于提取关键字的旧代码，因此我希望将代码调整为正则表达式.我想将正则表达式保存为字符串变量并在此处应用: data$ContentURL ..

发布时间：2021-07-06 19:36:00 regex r grepl 其他开发

grepl 一段“."在R?

假设我有一个字符串“Hello".我想看看这个字符串是否包含句点: text ..

发布时间：2021-07-06 19:19:05 r regex grepl 其他开发

在 R 中使用 grepl 完成单词匹配

考虑以下示例: >testLines grepl('is',testLines)>[1] 对对不过，我想要的是仅在“is"作为一个词单独存在时才匹配它.通过阅读一些 perl 文档，似乎这样做的方法是使用 \b，这是一个锚点，可用于识别模式前后的内容，即 \bword\b 匹配 'word' 但不匹配 'sword'.所以我尝试了以下 ..

发布时间：2021-07-06 19:08:24 regex r grepl 其他开发

使用 grepl 搜索文本中的多个子字符串之一

发布时间：2021-07-06 19:07:42 r regex grepl 其他开发

POSIX 字符类在基本 R 正则表达式中不起作用

我在将模式与 R 中的文本字符串匹配时遇到了一些问题. 当文本类似于 "lettersornumbersorspaces y lettersornumbersorspaces" 时，我试图用 grepl 获得 TRUE. 我正在使用以下 regex: ([:alnum:]|[:blank:])+[:blank:][yY][:blank:]([:alnum:]|[:blank:])+ ..

发布时间：2021-06-14 20:14:06 r regex pattern-matching grepl 其他开发

R根据应用于多个列的多个部分字符串过滤行

数据集样本: diag01 ..

发布时间：2021-05-02 20:39:29 r filter dplyr grepl 其他开发

Grepl组字符串并使用R计数所有字符串的频率

我有一列5万行的推文，它们来自csv文件中的文本(推文由句子，短语等组成).我正在尝试计算该列中几个单词的出现频率.与下面的操作相比，有没有更简单的方法? #读取我的文件推文 ..

发布时间：2021-04-24 20:52:07 r count grepl 其他开发

grepl相关内容