stringr相关内容

在R(StringR)中使用正则表达式提取用于购物篮分析的产品项目时出错

Order_id PRODUCT_NAME 1 普通-高附着力有机硅底漆-30ml,普通-天然保湿因子+HA 30ml 2 Sandal,Brown-44 3 醋酸盐正方形黑色过渡太阳镜,卡地亚-8221-边少绿色双色太阳镜,雷朋-飞行员-棕色双色-3026-钻石硬质坚硬镜片,Burberry-2A357-哈瓦那-飞行员-太阳镜,醋酸盐正方形-黑色-过渡性太阳镜,卡地亚-8221-边少绿色双 ..
发布时间:2022-08-18 15:51:10 其他开发

将完整的年龄从字符转换为R中的数字

我在R中有一个以人的完整年龄为字符串(例如,10年8个月23天)的数据集,我需要将其转换为有意义的数字变量。我正在考虑将其转换为人的年龄(这很难,因为月份有不同的天数)。因此,最佳解决方案可能是创建一个双精度变量,将年龄显示为10.6或10.8,这是一个数字变量,其中包含10年8个月5天大于10年7个月12天的信息。 以下是我拥有的当前变量的一个示例 library(tibble) ..
发布时间:2022-08-18 15:07:54 其他开发

消除R中2个向量的部分重叠部分

我想知道是否可以删除与f1公式中的元素部分重叠的n1字符向量中的部分。 例如,在n1中,我们看到"study_typecompare"&;"study_typecontrol"与f1中的study_type部分重叠。 因此,在desired_output中,我们希望删除其中的"study_type"部分。因为其他元素(例如time_wk_whn)在n1中与f1中的元素完全重叠,我们保 ..
发布时间:2022-02-28 19:30:04 其他开发

每n个字符的新列拆分字符串

假设我有一个这样的数据框,其中有一个字符串向量var2 var1 var2 1 abcdefghi 2 abcdefghijklmnop 3 abc 4 abcdefghijklmnopqrst 将每n个字符的var2拆分到每个字符串末尾的新列的最有效方式是什么? 例如,如果每4个字符,输出将如下所示: var1 var2 ..
发布时间:2022-02-25 22:19:26 其他开发

将数据框字符串列拆分为多个不同的列

我想要完成的是将一列拆分为多列.我希望第一列包含“F",第二列“US",第三列“CA6"或“DL",第四列包含“Z13"或“U13"等.我的整个 df 遵循相同的模式X.XX.XXXX.XXX 或 X.XX.XXX.XXX 或 X.XX.XX.XXX 我知道第三列是我的问题所在,因为长度不同.我过去只使用过 substr,我可以在这里使用一些 if 语句,但想学习如何使用 stringr 包和 P ..
发布时间:2021-12-01 20:58:20 其他开发

R 计数单词出现在列表元素中的次数

我有一个由单词组成的列表. >头(splitWords2)[[1]][1]“一些"“附加"“信息"“那个"“我们"“会"“需要"“复制"“那个"[11]“实验"“是"“如何"“多少"“醋"“应该"“是"“放置"“中"“每个"[21]“相同"“容器"“或"“什么"“工具"“使用"“测量"“质量"“的"“四"[31]“不同"“样品"“和"“蒸馏"“水"“冲洗"“后"“取"“它们"“取出"[[2]][ ..
发布时间:2021-11-16 23:02:43 其他开发

删除正则表达式前的字符 (R)

我有一个股票代码的字符向量,其中代码名称以以下形式连接到该代码所在的国家/地区:country_name/ticker_name.我试图拆分每个字符串并从 '/' 后面删除所有内容,返回仅包含股票代码名称的字符向量.这是一个示例向量: sample_string ..
发布时间:2021-08-31 18:47:53 其他开发

从字符串中提取最后一个大写

我正在 R 中练习正则表达式.我想提取最后出现的两个大写字母.我试过了 >str_extract("kjhdjkaYY,","[:upper:][:upper:]")[1]“YY" 而且它工作得很好.如果我想提取这种模式的最后一次出现怎么办.示例: function("kKKjhdjkaYY,")[1]“YY" 感谢您的帮助 解决方案 我们可以使用 stringi 包中的 stri ..
发布时间:2021-08-31 18:47:50 其他开发

如何将 str_extract_all 变成多列

这是正文: data$charge[1][1]“提交的计数 #1:违反;21 O.S. 645;提交的计数 #2:违反;21 O.S. 1541.1;案卷 1" 我目前正在尝试从法律数据中提取法规.我的代码如下所示: str_extract_all(data$charge[1:3], "(? ..
发布时间:2021-08-31 18:47:47 其他开发

正则表达式和字符串包

我是 R 新手,我的编程作业有问题. 输入是一首诗: poem 现在我需要提取所有大写字母并将它们组合成一个单词.我正在使用以下代码执行此操作: poem_cap 然后我取消列出poem_cap: one_word ..
发布时间:2021-08-31 18:47:38 其他开发

按组对值进行排序和连接

我有一个组和名称列表,如下面的 DF 所示.我希望按字母顺序排列这个列表,并连接由逗号分隔的每个名称,如下面的 DF2 所示.我以为这很简单,但事实证明它比预期的更具挑战性! DF 对于解决这个问题的任何帮助,无论是否有 dplyr 管道,我都会感谢每个组列出的未知数量的名称. 谢谢! 解决方案 我们可以使用data.table library(data.table)setD ..
发布时间:2021-08-31 18:47:35 其他开发

R 只删除“[";“]"从字符串

我有一个类似的东西: 测试[1]“[0 30.5 4.5 10.5 2 35 22.999999999999996 29 5.500000000000001 23.5 18 23.5 44.5 3 44.5 44.00000000000001 43 27 42 35.5 19.5 44.00000000000001 1 0 31 34 18 1.5 26 6 45.99999999999999 ..
发布时间:2021-08-31 18:47:32 其他开发

如何使用 stringr 函数替换精确的字符串?

我正在尝试使用 stringr 函数替换列中的确切字符串. 我试用的数据集是这样的: data 我想用“值"替换“值".我尝试了 str_replace(data$column, "Value", "Values"),但这会产生以下不需要的替换: [1] "Values" "Valuess" "Values" "Valuess" 我希望输出为: [1] "值" "值" "值" " ..
发布时间:2021-08-31 18:47:29 其他开发

使用 str_detect (或其他一些函数)和某种方法来循环遍历列表以基本上执行 vlookup

我一直在寻找一种方法来做到这一点,这里的一些结果似乎很相似,似乎没有任何效果,我也找不到一种方法可以像 excel 中的 vlookup 那样循环遍历列表.如果我错过了,我深表歉意. 我正在尝试使用 Mutate 向数据集添加一个新列.它要做的是使用 str_replace (或其他一些函数,如果需要)查看一列,然后循环访问另一个列表.我想用另一列中的相应值替换它找到的内容.本质上是 exc ..
发布时间:2021-08-31 18:47:26 其他开发

R stringR RegExp 策略,用于在没有先验知识的情况下对类似表达式进行分组

我有一份包含 5 万多个零件号的列表.我需要按产品类型对它们进行分组.零件号通常按顺序彼此靠近,尽管它们不是完全顺序的.产品描述总是相似的,但不遵循最佳规则.让我用下表来说明. |零件号 |说明 |产品类型 ||--------|-------------|-------------||A000443 |水瓶 |水 ||A000445 |含水|水 ||A000448 |WaterBotHold ..
发布时间:2021-08-31 18:47:24 其他开发