r - IT屋-程序员软件开发技术分享社区

限定符可以用于R中的正则表达式替换吗？

我的目标是用一个符号替换一个字符串，该符号重复的字符与该字符串的字符一样多，就像人们可以用\U\1替换大写字母一样，如果我的模式是(*)，我用x\q1或{\q1}x替换由x\q1或{\q1}x捕获的字符，因此我将获得与*捕获的字符一样多的x。这可能吗？我主要在sub,gsub中思考，但您可以使用stringi,stringr等其他库来回答。您可以方便地使用perl = TRUE或pe ..

发布时间：2022-09-24 13:44:41 r regex pcre character-replacement 其他开发

求矩阵中最大连通区域的大小

所以我有一个矩阵(n行乘m列)，希望找到具有最多连接的“1”的区域。例如，如果我有以下矩阵： 1 1 0 0 0 1 1 0 0 0 1 0 1 0 0 0 矩阵中有两个“1”区域。第一区域： 1 1 1 1 1 第二区域： 1 我想创建一个将输出最大值=5的算法。我认为这与深度优先搜索有关，但我只有基本R和访问少数几个包的权限。推荐答案 ..

发布时间：2022-09-23 22:41:26 r matrix depth-first-search region connected-components 其他开发

将2个数据帧的不同大小的列相乘

我在R中有两个不同的数据框。第一个df1包含许多城市的数据，每个城市都与其对应的州相关联。第二个包含按州聚合的数据，但将这些数据分成多个类。如下所示： states1 ..

发布时间：2022-09-23 10:35:56 r dataframe multiplication 其他开发

如何使用Formattable和COLOR_TILE对表格元素进行有条件的着色？

我正在尝试设置一个带有彩色瓷砖的表，这些瓷砖根据每列的平均值有条件地着色。基本上，如果值低于平均值，瓷砖将是红色的，如果值高于平均值，则是绿色的。我在下面的函数中使用了一个简单的If Else语句。我最终将使用“Formattable”程序包和该程序包中的COLOR_TILE函数。我已尝试编写自己的函数来挑选颜色，但它仅成功地标记了数据框中的第一行。 #library(forma ..

发布时间：2022-09-22 17:21:30 r function colors conditional-formatting formattable 其他开发

反算向量分数

我有数值向量，如c(1, 2, 3, 3, 2, 1, 3)或c(1, 4, 1, 4, 4, 1)，我想保留单个元素的位置，但交换/反转值，以便分别得到c(3, 2, 1, 1, 2, 3, 1)、c(4, 1, 4, 1, 1, 4)。为了实现这一点，我在下面编写了一个相当粗糙和难看的代码，并进行了大量的调试和修补... blah ..

发布时间：2022-09-22 15:13:00 r numeric 其他开发

在R中使用整数值而不是数值(例如1L和1)的好处

在R源代码中，大多数(但不是所有)函数对常量使用整数值： colnames ..

发布时间：2022-09-22 14:42:22 r function integer numeric interactive 其他开发

将数据框列转换为存储在列表中的矢量

我的数据由许多列/变量和三行组成。每个变量都是一个整数，各行和各列的值各不相同。以下是我的数据的最小示例： # Minimal example of data frame I have df ..

发布时间：2022-09-22 14:32:20 r list dataframe numeric 其他开发

将Unicode Emoji正确读入R

我有一组来自Facebook的评论(通过Sprint kr这样的系统获取)，其中包含文本和表情符号，我正试图在R中对它们进行各种分析，但在正确接收表情符号方面遇到了困难。例如：我有一个.csv(以UTF-8编码)，它将有一个消息行，其中包含以下内容： “这是正确的吗！？！？！请说这不是真的！我们家只吃原汁原味的瑞斯花生酱杯💚💚💚” 然后我以以下方式将其摄取到R中： ..

发布时间：2022-09-22 12:27:42 r text unicode utf-8 emoji 其他开发

在R中使用表情符号

我有一个CSV文件，其中包含很多表情符号： Person, Message, A, 😉, A, How are you?, B, 🙍 Alright!, A, 💃💃 我如何read.csv()进入R以使表情符号不会变成黑色？%s (我要跟踪表情符号随时间变化的使用情况👽) 推荐答案我的控制台有一种接受这些“字符”的字体： txt ..

发布时间：2022-09-22 10:42:52 r emoji 其他开发

如何将表情符号与R正则表达式匹配？

我想确定我的向量中包含表情符号的元素： x = c('😂', 'no', '🍹', '😀', 'no', '😛', '䨺', '감사') x # [1] "U0001f602" "no" "U0001f379" "U0001f600" "no" "U0001f61b" "䨺" "감사" 相关帖子只涉及其他语言，因为它们大多指的是专业 ..

发布时间：2022-09-21 23:32:33 r regex emoji utf-16 其他开发

R能读懂html编码的表情符号吗？

问题我的问题解释如下：如何使用R来读取包含��这样的HTML表情代码的字符串？我想： (1)在解析后的字符串中表示表情符号(例如，作为Unicode符号：🤗)，或 (2)将其转换为对应的文本(“:hugging face:”) 背景我有一个文本消息的XML数据集(来自Android/iOS应用程序Signal)，我正在为一个文本挖 ..

发布时间：2022-09-21 19:18:15 r xml emoji html-encode xml2 其他开发

动态命名自定义函数dplyr内的新变量/列变异并粘贴

我想稍微简化一下代码，并尝试使用自定义构建函数。我构建了以下虚拟对象： library(dplyr, tidyverse) ## string ..

发布时间：2022-09-06 20:20:59 r function dplyr dynamic paste 其他开发

如何使用R通过向量迭代或组合来构造输入字符串？

我正在尝试构建一个字符串向量作为模型测试的输入(它最终进入lmer函数)。对于不同的测试，我必须对列进行大量更改，因此在一开始就将它们声明到一个位置来执行此操作将真正加快过程。向量(字符串)由列标题(来自数据)组成。当前有两个固定的起点，然后我想在不重复且顺序不重要的情况下迭代可用列选项。示例输入： first_col ..

发布时间：2022-09-06 20:17:53 r for-loop vector combinations paste 其他开发

粘贴数据帧的列，然后查看它们(&Q)

我尝试粘贴两列数据帧，然后使用“View”函数查看结果字符向量，但收到以下错误： “视图中的错误：‘NAMES’属性[2]的长度必须与向量[1]相同” 以下是我的可重复使用的示例： name1 ..

发布时间：2022-09-06 20:10:04 r dataframe paste 其他开发

R中无重复的组合

我正在尝试获取变量元素的长度为3的所有可能组合。尽管它在一定程度上与comn()一起工作，但我没有得到我想要的输出。下面是我的例子 x ..

发布时间：2022-09-06 19:46:02 r variables combinations paste 其他开发

在R中粘贴字符串的最有效方法是什么？

我有两个非常大的向量，我需要用一个分隔符连接起来，以形成唯一的ID。例如： set.seed(1) vec1 ..

发布时间：2022-09-06 19:41:41 r performance paste 其他开发

为循环中的交叉验证准备测试/训练集

我正在尝试构建用于进行交叉验证的测试和培训组。我总共有95个个人ID，并尝试按如下方式完成任务： # create 95 unique IDs as individuals set.seed(1) indv ..

发布时间：2022-09-06 11:48:55 r for-loop cross-validation 其他开发

Caret：组合分层的createMultiFold(重复CV)和groupKFold

我的问题与中提出的问题非常相似 caret: combine createResample and groupKFold 唯一的区别是：我需要在分组后创建分层折叠(也重复10次)，而不是引导重采样(据我所知它不是分层的)，以便与插入的Train Control一起使用。下面的代码使用10倍重复的简历，但我不能包括基于“ID”(df$ID)的数据分组。 # creating indices ..

发布时间：2022-09-06 11:04:41 r cross-validation r-caret 其他开发

如何根据另一个矩阵的真/假索引替换矩阵中的值？

我一直在尝试用此矩阵中的0替换低于0的所有值： vec.1 ..

发布时间：2022-09-04 23:36:19 r matrix indexing logical-operators 其他开发

R中的xgBoost中的人类可读规则

我尝试在R中使用xgBoost从我的数据中获取规则(Gbtree)，这样我就可以在其他系统中使用这些规则(而不是带有‘Forecast’的预测数据)。输入数据具有很高的可信度。包含二进制稀疏数据的1500列和40 MIO行，标签也是二进制列。 library(xgboost) library(Matrix) labels ..

发布时间：2022-09-04 16:52:42 r xgboost 其他开发

r相关内容