data-manipulation相关内容

在数据框底部生成汇总表

请帮助! 我有以下数据框(名为Final_APOL1)。我需要生成一个汇总表,如所示的第二个数据框。生成后,是否可以将其另存为单独的输出csv,并将其保存到同一目录? 摘要表会遍历风险等位基因计数变量并将其放置 危险等位基因编号1、2或不存在的代码 “没有APOL1风险等位基因” = ifelse(`APOL1的最终基因型==“ G0 / G0”,1,NA), “ 1 ..
发布时间:2020-10-17 21:25:51 其他开发

R:根据数据框另一列中的不同信息合并列

我正试图为以下数据操纵目的找到一种更简便的方法。数据框是这样的: “对象”“ Date_In”“ Date_out”“标签”“房间”“ test” “ 1”“ LEU_A” 6 9“上”“ 11z”“ c” “ 2”“ LEU_A” 1 10“下”“ 14x”“ c” “ 3”“ LEU_B” 6 8“上”“ 11z”“ a1” “ 4”“ LEU_B” 10 13“下”“ 14x” ..
发布时间:2020-10-17 21:25:48 其他开发

R:将值转换为管道分隔格式

我正在尝试从SPSS输出创建REDCap数据字典。 SPSS列出每个变量的允许值或因子,如下所示: 性别0男性 1女性 语言1英语 2西班牙语 3其他 6未知 如何将上面的内容转换为REDCap的这种格式: 变量值 性别0 ,男| 1,女性 语言1,英语| 2,西班牙语| 3,其他| 6,未知的 我最喜欢的语言是R。 解决方案 这是 ..
发布时间:2020-10-17 21:25:46 其他开发

同时生成和排序变量

我想避免对数据进行重新排序,以将生成的变量放在第一列中: sysuse auto, clear gen random = runiform() 订单随机 是否可能生成一个变量并同时排序吗? 这个想法是当我在编辑器中浏览数据时能够直接观察生成的变量,当我有多个变量时,这并不容易。 解决方案 您可以使用 before()选项: sysuse自动 ..
发布时间:2020-10-17 21:25:27 其他开发

根据数字的不同范围,将数字映射到R中的分类值

希望我的头衔有意义。我有一个带有一列数字值的数据框,我想使用此列创建一个新列,从而根据其值将数字值“映射”到不同的存储桶中。下面是一些测试数据,以及我目前用于解决此问题的边缘粗糙的ifelse()方法。我希望以一种不涉及嵌套ifelse()语句的更好的方式对此进行编码,因为这种方法在许多存储桶中无法很好地扩展: mydf = data.frame(字符串=字母[1:10], 数字= c(0 ..
发布时间:2020-10-17 21:25:23 其他开发

根据两列R分配ID

我有一些看起来像这样的数据。我想通过电子邮件和wk_id分配一个“ ID”。 row_num电子邮件wk_id 1 aaaa 1/4 / 15 2 aaaa 1/11/15 3 aaaa 1/25/15 4 bbbb 6/29/14 5 bbbb 9/7/14 6 cccc 11/16/14 7 cccc 11/30/14 8 cccc 12/7/14 ..
发布时间:2020-10-17 21:25:19 其他开发

如何根据满足的两个条件之一创建列/索引(以在同一数据帧内实现匹配对的聚类)?

我有一个大的匹配对(id1和id2)数据集,并希望创建一个索引变量,使我能够将这些对合并为行。 这样,第一行将是索引1,从那以后索引将增加1,除非id1或id2与上一行中的任何值匹配。在这种情况下,应使用先前归属的索引。 我已经找了好几个星期了,大多数解决方案似乎都无法满足我的需求。 这里有一些数据可以复制我的内容: id1 id2 df ..
发布时间:2020-10-17 21:24:13 其他开发

比较如果满足条件(R),则复位序列的有效方法

问题: 如果要满足条件,我想重设(1,2)序列(主题更改)。 我有个和 if 个循环可以做到这一点,但是毫不奇怪,该方法非常慢。 关于更有效方法的任何建议(例如,涉及应征家庭)? 当前: 主题奇数偶数 a a a b b b b c c c 目标: 子奇数_偶数 a 1 a 2 a 1 b 1 b 2 b 1 ..
发布时间:2020-10-17 21:22:02 其他开发

在每行中删除一个多余的字符?

我有一个变量,由于某种原因,R在每个变量的开头添加了一个额外的“ X”。 无论如何,下面是我的数据(当前变量存储在列表中): X1 X5 X33 X37 ... > str(rc1_output) chr [1:63,1:3]“ X1”“ X5”“ X33”“ X37”“ X52”“ X645”“ X646” ... -attr(* ,“ dimnames” ..
发布时间:2020-10-17 21:21:53 其他开发

将分离的物种数量数据处理到物种丰度矩阵中

我希望有人可以为R中的某些数据处理提供帮助,因为当前数据的格式有些奇怪,所以我一直在努力使其工作。 我需要一个物种丰富度表才能在素食主义者中运行某些功能。 但是,当我收集数据时,我用不太兼容的方式输入了数据因为我必须从同一站点收集的物种按日期和其他因素分开,这对于另一个程序来说是必需的。 所以我的数据目前看起来像这样: df ..
发布时间:2020-10-17 21:21:51 其他开发

如何在另一列中的列中检测和标记更改

我正在尝试标记流程的开始和结束时间。 代码需要检测更改的开始时间和结束时间,并将其标记在另一列中。 示例数据: 日期处理 2007 0 2008 1 2009 1 2010 1 2011 1 2012 1 2013 0 目标: 日期进程状态 2007 0 NA 2008 1 Process_START 2009 1 NA ..
发布时间:2020-10-17 21:19:39 其他开发