r相关内容

限定符可以用于R中的正则表达式替换吗?

我的目标是用一个符号替换一个字符串,该符号重复的字符与该字符串的字符一样多,就像人们可以用\U\1替换大写字母一样,如果我的模式是(*),我用x\q1或{\q1}x替换由x\q1或{\q1}x捕获的字符,因此我将获得与*捕获的字符一样多的x。 这可能吗? 我主要在sub,gsub中思考,但您可以使用stringi,stringr等其他库来回答。 您可以方便地使用perl = TRUE或pe ..
发布时间:2022-09-24 13:44:41 其他开发

求矩阵中最大连通区域的大小

所以我有一个矩阵(n行乘m列),希望找到具有最多连接的“1”的区域。例如,如果我有以下矩阵: 1 1 0 0 0 1 1 0 0 0 1 0 1 0 0 0 矩阵中有两个“1”区域。 第一区域: 1 1 1 1 1 第二区域: 1 我想创建一个将输出最大值=5的算法。我认为这与深度优先搜索有关,但我只有基本R和访问少数几个包的权限。 推荐答案 ..
发布时间:2022-09-23 22:41:26 其他开发

如何使用Formattable和COLOR_TILE对表格元素进行有条件的着色?

我正在尝试设置一个带有彩色瓷砖的表,这些瓷砖根据每列的平均值有条件地着色。基本上,如果值低于平均值,瓷砖将是红色的,如果值高于平均值,则是绿色的。我在下面的函数中使用了一个简单的If Else语句。 我最终将使用“Formattable”程序包和该程序包中的COLOR_TILE函数。 我已尝试编写自己的函数来挑选颜色,但它仅成功地标记了数据框中的第一行。 #library(forma ..
发布时间:2022-09-22 17:21:30 其他开发

反算向量分数

我有数值向量,如c(1, 2, 3, 3, 2, 1, 3)或c(1, 4, 1, 4, 4, 1),我想保留单个元素的位置,但交换/反转值,以便分别得到c(3, 2, 1, 1, 2, 3, 1)、c(4, 1, 4, 1, 1, 4)。 为了实现这一点,我在下面编写了一个相当粗糙和难看的代码,并进行了大量的调试和修补... blah ..
发布时间:2022-09-22 15:13:00 其他开发

将Unicode Emoji正确读入R

我有一组来自Facebook的评论(通过Sprint kr这样的系统获取),其中包含文本和表情符号,我正试图在R中对它们进行各种分析,但在正确接收表情符号方面遇到了困难。 例如:我有一个.csv(以UTF-8编码),它将有一个消息行,其中包含以下内容: “这是正确的吗!?!?!请说这不是真的!我们家只吃原汁原味的瑞斯花生酱杯💚💚💚” 然后我以以下方式将其摄取到R中: ..
发布时间:2022-09-22 12:27:42 其他开发

在R中使用表情符号

我有一个CSV文件,其中包含很多表情符号: Person, Message, A, 😉, A, How are you?, B, 🙍 Alright!, A, 💃💃 我如何read.csv()进入R以使表情符号不会变成黑色?%s (我要跟踪表情符号随时间变化的使用情况👽) 推荐答案 我的控制台有一种接受这些“字符”的字体: txt ..
发布时间:2022-09-22 10:42:52 其他开发

如何将表情符号与R正则表达式匹配?

我想确定我的向量中包含表情符号的元素: x = c('😂', 'no', '🍹', '😀', 'no', '😛', '䨺', '감사') x # [1] "U0001f602" "no" "U0001f379" "U0001f600" "no" "U0001f61b" "䨺" "감사" 相关帖子只涉及其他语言,因为它们大多指的是专业 ..
发布时间:2022-09-21 23:32:33 其他开发

R能读懂html编码的表情符号吗?

问题 我的问题解释如下: 如何使用R来读取包含��这样的HTML表情代码的字符串? 我想: (1)在解析后的字符串中表示表情符号(例如,作为Unicode符号:🤗),或 (2)将其转换为对应的文本(“:hugging face:”) 背景 我有一个文本消息的XML数据集(来自Android/iOS应用程序Signal),我正在为一个文本挖 ..
发布时间:2022-09-21 19:18:15 其他开发

如何使用R通过向量迭代或组合来构造输入字符串?

我正在尝试构建一个字符串向量作为模型测试的输入(它最终进入lmer函数)。对于不同的测试,我必须对列进行大量更改,因此在一开始就将它们声明到一个位置来执行此操作将真正加快过程。 向量(字符串)由列标题(来自数据)组成。 当前有两个固定的起点,然后我想在不重复且顺序不重要的情况下迭代可用列选项。 示例输入: first_col ..
发布时间:2022-09-06 20:17:53 其他开发

Caret:组合分层的createMultiFold(重复CV)和groupKFold

我的问题与中提出的问题非常相似 caret: combine createResample and groupKFold 唯一的区别是:我需要在分组后创建分层折叠(也重复10次),而不是引导重采样(据我所知它不是分层的),以便与插入的Train Control一起使用。 下面的代码使用10倍重复的简历,但我不能包括基于“ID”(df$ID)的数据分组。 # creating indices ..
发布时间:2022-09-06 11:04:41 其他开发

R中的xgBoost中的人类可读规则

我尝试在R中使用xgBoost从我的数据中获取规则(Gbtree),这样我就可以在其他系统中使用这些规则(而不是带有‘Forecast’的预测数据)。输入数据具有很高的可信度。包含二进制稀疏数据的1500列和40 MIO行,标签也是二进制列。 library(xgboost) library(Matrix) labels ..
发布时间:2022-09-04 16:52:42 其他开发