gsub相关内容

每n个字符的新列拆分字符串

假设我有一个这样的数据框,其中有一个字符串向量var2 var1 var2 1 abcdefghi 2 abcdefghijklmnop 3 abc 4 abcdefghijklmnopqrst 将每n个字符的var2拆分到每个字符串末尾的新列的最有效方式是什么? 例如,如果每4个字符,输出将如下所示: var1 var2 ..
发布时间:2022-02-25 22:19:26 其他开发

使用分组时如何使用 gsub 在 Ruby 正则表达式 (regex) 中反向引用?

我想修补一些从网页中提取的文本数据.示例: t="第一句.第二句.第三句." 第二句末尾的点后没有空格.这表明第 3 个句子在原始文档中位于单独的一行中(在 br 标签之后). 我想使用这个正则表达式将“\n"字符插入到适当的位置并修补我的文本.我的正则表达式: t2=t.gsub(/([.\!?])([A-Z1-9])/,$1+"\n"+$2) 但不幸的是它不起作用:“NoMeth ..
发布时间:2022-01-05 12:12:20 其他开发

Lua前沿模式匹配(全词搜索)

有人可以帮我吗: s_test = "这是一个测试字符串这是一个测试字符串"函数 String.Wholefind(Search_string, Word)_, F_result = string.gsub(Search_string, '%f[%a]'..Word..'%f[%A]',"")返回 F_result结尾A_test = String.Wholefind(s_test,"strin ..
发布时间:2021-12-30 20:39:11 其他开发

Lua中修改字符串中的字符

有没有办法在Lua中替换字符串中位置N处的字符. 这是我目前想到的: function replace_char(pos, str, r)返回 str:sub(pos, pos - 1) .. r .. str:sub(pos + 1, str:len())结尾str = replace_char(2, "aaaaaa", "X")打印(字符串) 我也不能使用 gsub,因为它会替换每个 ..
发布时间:2021-12-30 20:22:19 其他开发

带连字符的 Lua string.gsub

我有两个字符串 - 每个字符串有很多行,如下所示: value_1 = "DEFAULT-VLAN"value_2 = "广域网"数据 = "HOSTNAME = DEFAULT-VLAN"结果 = string.gsub(data,value_1,value_2)打印(结果) 结果: data = "HOSTNAME = DEFAULT-VLAN" 当连字符(“-")从它正在工作的值中删 ..
发布时间:2021-12-30 20:11:33 其他开发

从 R 中的整个数据帧中删除空白

我一直在尝试删除数据框中的空白区域(使用 R).数据框很大 (>1gb) 并且有多个列,每个数据条目中都包含空格. 有没有一种快速的方法可以从整个数据框中删除空白?我一直在尝试使用以下方法对前 10 行数据的子集执行此操作: gsub( " ", "", mydata) 这似乎不起作用,尽管 R 返回了我无法解释的输出. str_replace( " ", "", mydata) R ..
发布时间:2021-12-25 08:56:54 其他开发

用 gsub 用重音符号替换多个字母

当然我可以像这样替换特定的参数: mydata=c("á","é","ó")mydata=gsub("á","a",mydata)mydata=gsub("é","e",mydata)mydata=gsub("ó","o",mydata)我的数据 但肯定有一种更简单的方法可以在线完成这一切,对吗?我觉得 gsub 的帮助不是很全面. 解决方案 使用字符翻译功能 chartr("áé ..
发布时间:2021-12-01 21:19:19 其他开发

通过 sapply 应用多个功能

我正在尝试复制在 sapply 中应用多个函数的解决方案 R-Bloggers 但我无法让它以所需的方式工作.我正在处理一个简单的数据集,类似于下面生成的数据集: require(数据集)crs_mat ..
发布时间:2021-11-16 23:15:55 其他开发

正则表达式删除 <> 之间的所有内容

我正在学习网络抓取.我掌握了一堆数据,但结构混乱. 我有一个这种形式的字符串向量: "9,55x1016",(现在写的时候觉得是特殊的语法,因为不加空格就不能粘贴在这里在“U"之前)在我抓取的网站上写成“9,55*10^16". 从长远来看,我的目标是将此字符串转换为数字变量,即 95500000000000000.但首先我想删除第一个“ ..
发布时间:2021-09-24 18:54:58 其他开发

使用 R 从文本中删除日期和所有垃圾

我正在使用 R 清理由数万个文本组成的庞大数据集.我知道正则表达式可以方便地完成这项工作,但我不擅长使用它.我已经梳理过stackoverflow,但找不到解决方案.这是我的虚拟数据: foo_data 我想删除所有日期、标点符号和 ID,并希望我的结果是这样的: [1] “教育好";[2]“健康为先"[3]“经济不景气"[4]“需要车辆执照" R 中的任何帮助将不胜感激. 解决方 ..
发布时间:2021-09-06 19:13:44 其他开发

如何在R中的数据帧中删除字符串末尾的一两个单词?

我有一个名为“Country"的行的数据框.例如,当原产国为美国时,条目将列为“路易斯安那州 - 美国".我试图去掉最后的“-USA",这样它只会说它来自哪个州. 所以,我目前有这样的东西(虽然我的有数千个条目): df 我尝试的是以下内容: for (i in 1:nrow(df)) {df$USA[i] ..
发布时间:2021-08-31 18:45:40 其他开发

如何编写一个for循环以将多个csv文件读入R并子集数据以为ggplots制作干净的数据帧?

我正在尝试将多个csv读入R,然后通过使用'subset'函数删除不需要的列来对这些csvs进行子集化.我正在尝试在r中设置一个for循环,可以将功能或计算添加到csvs列表中,以便为以后生成ggplots或stat分析提供数据框.(我目前安装了tidyverse,dplyr和ggplot2).现在,我只想对csvs进行子集化,然后从子集化的数据中创建一个数据框. 我使用for循环通过设置工 ..
发布时间:2021-05-13 19:59:09 其他开发