stringr - IT屋-程序员软件开发技术分享社区

在R(StringR)中使用正则表达式提取用于购物篮分析的产品项目时出错

Order_id PRODUCT_NAME 1 普通-高附着力有机硅底漆-30ml，普通-天然保湿因子+HA 30ml 2 Sandal，Brown-44 3 醋酸盐正方形黑色过渡太阳镜，卡地亚-8221-边少绿色双色太阳镜，雷朋-飞行员-棕色双色-3026-钻石硬质坚硬镜片，Burberry-2A357-哈瓦那-飞行员-太阳镜，醋酸盐正方形-黑色-过渡性太阳镜，卡地亚-8221-边少绿色双 ..

发布时间：2022-08-18 15:51:10 r dplyr data-cleaning stringr data-wrangling 其他开发

将完整的年龄从字符转换为R中的数字

我在R中有一个以人的完整年龄为字符串(例如，10年8个月23天)的数据集，我需要将其转换为有意义的数字变量。我正在考虑将其转换为人的年龄(这很难，因为月份有不同的天数)。因此，最佳解决方案可能是创建一个双精度变量，将年龄显示为10.6或10.8，这是一个数字变量，其中包含10年8个月5天大于10年7个月12天的信息。以下是我拥有的当前变量的一个示例 library(tibble) ..

发布时间：2022-08-18 15:07:54 r data-cleaning lubridate stringr data-wrangling 其他开发

使用R中的str_plit()从定制函数中的df$VECTOR中提取向量名称

我一直在尝试编写一个自定义函数，该函数将输入对象x中的变量名作为字符串输出，输入对象x是数据帧中的特定向量，即df$VECTOR的形式，因此它的功能如下 function(iris$Species) >"Species" 目前我正在执行以下操作： vector.name ..

发布时间：2022-08-08 18:47:37 r string extract stringr strsplit 其他开发

如何使用tidyr：：Separate在R中拆分字符串并保留分隔符字符串的值？

我有一个数据集： crimes ..

发布时间：2022-04-17 22:48:59 r tidyr stringr 其他开发

消除R中2个向量的部分重叠部分

我想知道是否可以删除与f1公式中的元素部分重叠的n1字符向量中的部分。例如，在n1中，我们看到"study_typecompare"&；"study_typecontrol"与f1中的study_type部分重叠。因此，在desired_output中，我们希望删除其中的"study_type"部分。因为其他元素(例如time_wk_whn)在n1中与f1中的元素完全重叠，我们保 ..

发布时间：2022-02-28 19:30:04 r string tidyverse stringr 其他开发

每n个字符的新列拆分字符串

假设我有一个这样的数据框，其中有一个字符串向量var2 var1 var2 1 abcdefghi 2 abcdefghijklmnop 3 abc 4 abcdefghijklmnopqrst 将每n个字符的var2拆分到每个字符串末尾的新列的最有效方式是什么？例如，如果每4个字符，输出将如下所示： var1 var2 ..

发布时间：2022-02-25 22:19:26 r substring gsub stringr 其他开发

str_extract_all:返回在字符串中找到的所有模式连接为向量

我想提取除模式之外的所有内容并将其返回到字符串中. 我尝试将 str_extract_all 与 sapply 和 cat 结合起来 x = c("a_1","a_20","a_40","a_30","a_28")数据 %变异(age_new = str_extract(age,"[^a_]"))# 结合 str_ext ..

发布时间：2021-12-23 12:54:21 r dplyr stringr 其他开发

dplyr:具有部分字符串匹配的inner_join

如果数据框 y 中的 seed 列与 string 列中的部分匹配，我想加入两个数据框x.这个例子应该说明: # 我有什么x ..

发布时间：2021-12-17 20:05:53 r string join dplyr stringr 其他开发

将数据框字符串列拆分为多个不同的列

我想要完成的是将一列拆分为多列.我希望第一列包含“F"，第二列“US"，第三列“CA6"或“DL"，第四列包含“Z13"或“U13"等.我的整个 df 遵循相同的模式X.XX.XXXX.XXX 或 X.XX.XXX.XXX 或 X.XX.XX.XXX 我知道第三列是我的问题所在，因为长度不同.我过去只使用过 substr，我可以在这里使用一些 if 语句，但想学习如何使用 stringr 包和 P ..

发布时间：2021-12-01 20:58:20 r split dataframe stringr 其他开发

R 计数单词出现在列表元素中的次数

我有一个由单词组成的列表. >头(splitWords2)[[1]][1]“一些"“附加"“信息"“那个"“我们"“会"“需要"“复制"“那个"[11]“实验"“是"“如何"“多少"“醋"“应该"“是"“放置"“中"“每个"[21]“相同"“容器"“或"“什么"“工具"“使用"“测量"“质量"“的"“四"[31]“不同"“样品"“和"“蒸馏"“水"“冲洗"“后"“取"“它们"“取出"[[2]][ ..

发布时间：2021-11-16 23:02:43 r list apply stringr 其他开发

删除正则表达式前的字符 (R)

我有一个股票代码的字符向量，其中代码名称以以下形式连接到该代码所在的国家/地区:country_name/ticker_name.我试图拆分每个字符串并从 '/' 后面删除所有内容，返回仅包含股票代码名称的字符向量.这是一个示例向量: sample_string ..

发布时间：2021-08-31 18:47:53 r split stringr 其他开发

从字符串中提取最后一个大写

我正在 R 中练习正则表达式.我想提取最后出现的两个大写字母.我试过了 >str_extract("kjhdjkaYY,","[:upper:][:upper:]")[1]“YY" 而且它工作得很好.如果我想提取这种模式的最后一次出现怎么办.示例: function("kKKjhdjkaYY,")[1]“YY" 感谢您的帮助解决方案我们可以使用 stringi 包中的 stri ..

发布时间：2021-08-31 18:47:50 r regex stringr 其他开发

如何将 str_extract_all 变成多列

这是正文: data$charge[1][1]“提交的计数 #1:违反；21 O.S. 645；提交的计数 #2:违反；21 O.S. 1541.1；案卷 1" 我目前正在尝试从法律数据中提取法规.我的代码如下所示: str_extract_all(data$charge[1:3], "(? ..

发布时间：2021-08-31 18:47:47 r stringr 其他开发

替换数字后面的句点

我遇到了一个看似简单的问题，但我找到的解决方案并不令人满意.我想用逗号替换任何后跟数字的句点.例如， strings ..

发布时间：2021-08-31 18:47:45 regex r stringr 其他开发

正则表达式和字符串包

我是 R 新手，我的编程作业有问题. 输入是一首诗: poem 现在我需要提取所有大写字母并将它们组合成一个单词.我正在使用以下代码执行此操作: poem_cap 然后我取消列出poem_cap: one_word ..

发布时间：2021-08-31 18:47:38 regex r stringr 其他开发

按组对值进行排序和连接

我有一个组和名称列表，如下面的 DF 所示.我希望按字母顺序排列这个列表，并连接由逗号分隔的每个名称，如下面的 DF2 所示.我以为这很简单，但事实证明它比预期的更具挑战性！ DF 对于解决这个问题的任何帮助，无论是否有 dplyr 管道，我都会感谢每个组列出的未知数量的名称. 谢谢！解决方案我们可以使用data.table library(data.table)setD ..

发布时间：2021-08-31 18:47:35 r dataframe dplyr tidyr stringr 其他开发

R 只删除“[";“]"从字符串

我有一个类似的东西: 测试[1]“[0 30.5 4.5 10.5 2 35 22.999999999999996 29 5.500000000000001 23.5 18 23.5 44.5 3 44.5 44.00000000000001 43 27 42 35.5 19.5 44.00000000000001 1 0 31 34 18 1.5 26 6 45.99999999999999 ..

发布时间：2021-08-31 18:47:32 regex r stringr 其他开发

如何使用 stringr 函数替换精确的字符串?

我正在尝试使用 stringr 函数替换列中的确切字符串. 我试用的数据集是这样的: data 我想用“值"替换“值".我尝试了 str_replace(data$column, "Value", "Values")，但这会产生以下不需要的替换: [1] "Values" "Valuess" "Values" "Valuess" 我希望输出为: [1] "值" "值" "值" " ..

发布时间：2021-08-31 18:47:29 r regex stringr 其他开发

使用 str_detect (或其他一些函数)和某种方法来循环遍历列表以基本上执行 vlookup

我一直在寻找一种方法来做到这一点，这里的一些结果似乎很相似，似乎没有任何效果，我也找不到一种方法可以像 excel 中的 vlookup 那样循环遍历列表.如果我错过了，我深表歉意. 我正在尝试使用 Mutate 向数据集添加一个新列.它要做的是使用 str_replace (或其他一些函数，如果需要)查看一列，然后循环访问另一个列表.我想用另一列中的相应值替换它找到的内容.本质上是 exc ..

发布时间：2021-08-31 18:47:26 r stringr 其他开发

R stringR RegExp 策略，用于在没有先验知识的情况下对类似表达式进行分组

我有一份包含 5 万多个零件号的列表.我需要按产品类型对它们进行分组.零件号通常按顺序彼此靠近，尽管它们不是完全顺序的.产品描述总是相似的，但不遵循最佳规则.让我用下表来说明. |零件号 |说明 |产品类型 ||--------|-------------|-------------||A000443 |水瓶 |水 ||A000445 |含水|水 ||A000448 |WaterBotHold ..

发布时间：2021-08-31 18:47:24 r regex stringr 其他开发

stringr相关内容