stringr相关内容
Order_id PRODUCT_NAME 1 普通-高附着力有机硅底漆-30ml,普通-天然保湿因子+HA 30ml 2 Sandal,Brown-44 3 醋酸盐正方形黑色过渡太阳镜,卡地亚-8221-边少绿色双色太阳镜,雷朋-飞行员-棕色双色-3026-钻石硬质坚硬镜片,Burberry-2A357-哈瓦那-飞行员-太阳镜,醋酸盐正方形-黑色-过渡性太阳镜,卡地亚-8221-边少绿色双
..
我在R中有一个以人的完整年龄为字符串(例如,10年8个月23天)的数据集,我需要将其转换为有意义的数字变量。我正在考虑将其转换为人的年龄(这很难,因为月份有不同的天数)。因此,最佳解决方案可能是创建一个双精度变量,将年龄显示为10.6或10.8,这是一个数字变量,其中包含10年8个月5天大于10年7个月12天的信息。 以下是我拥有的当前变量的一个示例 library(tibble)
..
我一直在尝试编写一个自定义函数,该函数将输入对象x中的变量名作为字符串输出,输入对象x是数据帧中的特定向量,即df$VECTOR的形式,因此它的功能如下 function(iris$Species) >"Species" 目前我正在执行以下操作: vector.name
..
我有一个数据集: crimes
..
我想知道是否可以删除与f1公式中的元素部分重叠的n1字符向量中的部分。 例如,在n1中,我们看到"study_typecompare"&;"study_typecontrol"与f1中的study_type部分重叠。 因此,在desired_output中,我们希望删除其中的"study_type"部分。因为其他元素(例如time_wk_whn)在n1中与f1中的元素完全重叠,我们保
..
假设我有一个这样的数据框,其中有一个字符串向量var2 var1 var2 1 abcdefghi 2 abcdefghijklmnop 3 abc 4 abcdefghijklmnopqrst 将每n个字符的var2拆分到每个字符串末尾的新列的最有效方式是什么? 例如,如果每4个字符,输出将如下所示: var1 var2
..
我想提取除模式之外的所有内容并将其返回到字符串中. 我尝试将 str_extract_all 与 sapply 和 cat 结合起来 x = c("a_1","a_20","a_40","a_30","a_28")数据 %变异(age_new = str_extract(age,"[^a_]"))# 结合 str_ext
..
如果数据框 y 中的 seed 列与 string 列中的部分匹配,我想加入两个数据框x.这个例子应该说明: # 我有什么x
..
我想要完成的是将一列拆分为多列.我希望第一列包含“F",第二列“US",第三列“CA6"或“DL",第四列包含“Z13"或“U13"等.我的整个 df 遵循相同的模式X.XX.XXXX.XXX 或 X.XX.XXX.XXX 或 X.XX.XX.XXX 我知道第三列是我的问题所在,因为长度不同.我过去只使用过 substr,我可以在这里使用一些 if 语句,但想学习如何使用 stringr 包和 P
..
我有一个由单词组成的列表. >头(splitWords2)[[1]][1]“一些"“附加"“信息"“那个"“我们"“会"“需要"“复制"“那个"[11]“实验"“是"“如何"“多少"“醋"“应该"“是"“放置"“中"“每个"[21]“相同"“容器"“或"“什么"“工具"“使用"“测量"“质量"“的"“四"[31]“不同"“样品"“和"“蒸馏"“水"“冲洗"“后"“取"“它们"“取出"[[2]][
..
我有一个股票代码的字符向量,其中代码名称以以下形式连接到该代码所在的国家/地区:country_name/ticker_name.我试图拆分每个字符串并从 '/' 后面删除所有内容,返回仅包含股票代码名称的字符向量.这是一个示例向量: sample_string
..
我正在 R 中练习正则表达式.我想提取最后出现的两个大写字母.我试过了 >str_extract("kjhdjkaYY,","[:upper:][:upper:]")[1]“YY" 而且它工作得很好.如果我想提取这种模式的最后一次出现怎么办.示例: function("kKKjhdjkaYY,")[1]“YY" 感谢您的帮助 解决方案 我们可以使用 stringi 包中的 stri
..
这是正文: data$charge[1][1]“提交的计数 #1:违反;21 O.S. 645;提交的计数 #2:违反;21 O.S. 1541.1;案卷 1" 我目前正在尝试从法律数据中提取法规.我的代码如下所示: str_extract_all(data$charge[1:3], "(?
..
我遇到了一个看似简单的问题,但我找到的解决方案并不令人满意.我想用逗号替换任何后跟数字的句点.例如, strings
..
我是 R 新手,我的编程作业有问题. 输入是一首诗: poem 现在我需要提取所有大写字母并将它们组合成一个单词.我正在使用以下代码执行此操作: poem_cap 然后我取消列出poem_cap: one_word
..
我有一个组和名称列表,如下面的 DF 所示.我希望按字母顺序排列这个列表,并连接由逗号分隔的每个名称,如下面的 DF2 所示.我以为这很简单,但事实证明它比预期的更具挑战性! DF 对于解决这个问题的任何帮助,无论是否有 dplyr 管道,我都会感谢每个组列出的未知数量的名称. 谢谢! 解决方案 我们可以使用data.table library(data.table)setD
..
我有一个类似的东西: 测试[1]“[0 30.5 4.5 10.5 2 35 22.999999999999996 29 5.500000000000001 23.5 18 23.5 44.5 3 44.5 44.00000000000001 43 27 42 35.5 19.5 44.00000000000001 1 0 31 34 18 1.5 26 6 45.99999999999999
..
我正在尝试使用 stringr 函数替换列中的确切字符串. 我试用的数据集是这样的: data 我想用“值"替换“值".我尝试了 str_replace(data$column, "Value", "Values"),但这会产生以下不需要的替换: [1] "Values" "Valuess" "Values" "Valuess" 我希望输出为: [1] "值" "值" "值" "
..
我一直在寻找一种方法来做到这一点,这里的一些结果似乎很相似,似乎没有任何效果,我也找不到一种方法可以像 excel 中的 vlookup 那样循环遍历列表.如果我错过了,我深表歉意. 我正在尝试使用 Mutate 向数据集添加一个新列.它要做的是使用 str_replace (或其他一些函数,如果需要)查看一列,然后循环访问另一个列表.我想用另一列中的相应值替换它找到的内容.本质上是 exc
..
我有一份包含 5 万多个零件号的列表.我需要按产品类型对它们进行分组.零件号通常按顺序彼此靠近,尽管它们不是完全顺序的.产品描述总是相似的,但不遵循最佳规则.让我用下表来说明. |零件号 |说明 |产品类型 ||--------|-------------|-------------||A000443 |水瓶 |水 ||A000445 |含水|水 ||A000448 |WaterBotHold
..