r相关内容
我的目标是用一个符号替换一个字符串,该符号重复的字符与该字符串的字符一样多,就像人们可以用\U\1替换大写字母一样,如果我的模式是(*),我用x\q1或{\q1}x替换由x\q1或{\q1}x捕获的字符,因此我将获得与*捕获的字符一样多的x。 这可能吗? 我主要在sub,gsub中思考,但您可以使用stringi,stringr等其他库来回答。 您可以方便地使用perl = TRUE或pe
..
所以我有一个矩阵(n行乘m列),希望找到具有最多连接的“1”的区域。例如,如果我有以下矩阵: 1 1 0 0 0 1 1 0 0 0 1 0 1 0 0 0 矩阵中有两个“1”区域。 第一区域: 1 1 1 1 1 第二区域: 1 我想创建一个将输出最大值=5的算法。我认为这与深度优先搜索有关,但我只有基本R和访问少数几个包的权限。 推荐答案
..
我在R中有两个不同的数据框。第一个df1包含许多城市的数据,每个城市都与其对应的州相关联。第二个包含按州聚合的数据,但将这些数据分成多个类。如下所示: states1
..
我正在尝试设置一个带有彩色瓷砖的表,这些瓷砖根据每列的平均值有条件地着色。基本上,如果值低于平均值,瓷砖将是红色的,如果值高于平均值,则是绿色的。我在下面的函数中使用了一个简单的If Else语句。 我最终将使用“Formattable”程序包和该程序包中的COLOR_TILE函数。 我已尝试编写自己的函数来挑选颜色,但它仅成功地标记了数据框中的第一行。 #library(forma
..
我有数值向量,如c(1, 2, 3, 3, 2, 1, 3)或c(1, 4, 1, 4, 4, 1),我想保留单个元素的位置,但交换/反转值,以便分别得到c(3, 2, 1, 1, 2, 3, 1)、c(4, 1, 4, 1, 1, 4)。 为了实现这一点,我在下面编写了一个相当粗糙和难看的代码,并进行了大量的调试和修补... blah
..
在R源代码中,大多数(但不是所有)函数对常量使用整数值: colnames
..
我的数据由许多列/变量和三行组成。每个变量都是一个整数,各行和各列的值各不相同。以下是我的数据的最小示例: # Minimal example of data frame I have df
..
我有一组来自Facebook的评论(通过Sprint kr这样的系统获取),其中包含文本和表情符号,我正试图在R中对它们进行各种分析,但在正确接收表情符号方面遇到了困难。 例如:我有一个.csv(以UTF-8编码),它将有一个消息行,其中包含以下内容: “这是正确的吗!?!?!请说这不是真的!我们家只吃原汁原味的瑞斯花生酱杯💚💚💚” 然后我以以下方式将其摄取到R中:
..
我有一个CSV文件,其中包含很多表情符号: Person, Message, A, 😉, A, How are you?, B, 🙍 Alright!, A, 💃💃 我如何read.csv()进入R以使表情符号不会变成黑色?%s (我要跟踪表情符号随时间变化的使用情况👽) 推荐答案 我的控制台有一种接受这些“字符”的字体: txt
..
我想确定我的向量中包含表情符号的元素: x = c('😂', 'no', '🍹', '😀', 'no', '😛', '䨺', '감사') x # [1] "U0001f602" "no" "U0001f379" "U0001f600" "no" "U0001f61b" "䨺" "감사" 相关帖子只涉及其他语言,因为它们大多指的是专业
..
问题 我的问题解释如下: 如何使用R来读取包含这样的HTML表情代码的字符串? 我想: (1)在解析后的字符串中表示表情符号(例如,作为Unicode符号:🤗),或 (2)将其转换为对应的文本(“:hugging face:”) 背景 我有一个文本消息的XML数据集(来自Android/iOS应用程序Signal),我正在为一个文本挖
..
我想稍微简化一下代码,并尝试使用自定义构建函数。我构建了以下虚拟对象: library(dplyr, tidyverse) ## string
..
我正在尝试构建一个字符串向量作为模型测试的输入(它最终进入lmer函数)。对于不同的测试,我必须对列进行大量更改,因此在一开始就将它们声明到一个位置来执行此操作将真正加快过程。 向量(字符串)由列标题(来自数据)组成。 当前有两个固定的起点,然后我想在不重复且顺序不重要的情况下迭代可用列选项。 示例输入: first_col
..
我尝试粘贴两列数据帧,然后使用“View”函数查看结果字符向量,但收到以下错误: “视图中的错误:‘NAMES’属性[2]的长度必须与向量[1]相同” 以下是我的可重复使用的示例: name1
..
我正在尝试获取变量元素的长度为3的所有可能组合。尽管它在一定程度上与comn()一起工作,但我没有得到我想要的输出。下面是我的例子 x
..
我有两个非常大的向量,我需要用一个分隔符连接起来,以形成唯一的ID。例如: set.seed(1) vec1
..
我正在尝试构建用于进行交叉验证的测试和培训组。我总共有95个个人ID,并尝试按如下方式完成任务: # create 95 unique IDs as individuals set.seed(1) indv
..
我的问题与中提出的问题非常相似 caret: combine createResample and groupKFold 唯一的区别是:我需要在分组后创建分层折叠(也重复10次),而不是引导重采样(据我所知它不是分层的),以便与插入的Train Control一起使用。 下面的代码使用10倍重复的简历,但我不能包括基于“ID”(df$ID)的数据分组。 # creating indices
..
我一直在尝试用此矩阵中的0替换低于0的所有值: vec.1
..
我尝试在R中使用xgBoost从我的数据中获取规则(Gbtree),这样我就可以在其他系统中使用这些规则(而不是带有‘Forecast’的预测数据)。输入数据具有很高的可信度。包含二进制稀疏数据的1500列和40 MIO行,标签也是二进制列。 library(xgboost) library(Matrix) labels
..