data-manipulation相关内容
我有一组二进制变量(值为0和1),我想创建一个双向计数表,总结变量对的同现计数(即,它们的值都为1)。以下是一个数据集示例: mm
..
我已经将一些原始数据导入到R中,如下所示: 表1: ID Year Value 01 1999 25 01 2000 12 01 2002 14 02 1998 16 02 2003 0 02 2004 14 该表按ID和年份排序,但如您所见,某些年份丢失了。我
..
编辑: 我有以下学生数据框,显示他们在不同日期的考试成绩(已排序): df = pd.DataFrame({'student': 'A A A B B B B C C'.split(), 'exam_date':[datetime.datetime(2013,4,1),datetime.datetime(2013,6,1),
..
我正在使用R编程语言。假设我有以下数据框: a = rnorm(100,10,1) b = rnorm(100,10,5) c = rnorm(100,10,10) my_data = data.frame(a,b,c) head(my_data) a b c 1 9.623328 10.560865 18.520644 2 7.805
..
我有条件填充在字符串中定义的新列。 condition_string = "colA='yes' & colB='yes' & (colC='yes' | colD='yes'): 'Yes', colA='no' & colB='no' & (colC='no' | colD='no'): 'No', ELSE : 'UNKNOWN'" 可以用任何其他格式(词典)重写/构造字符串,然
..
我正在使用R编程语言。假设我有以下数据框: var_1 = rnorm(100,10,10) var_2 = rnorm(100,10,10) var_3 = rnorm(100,10,10) d = data.frame(var_1, var_2, var_3) head(d) var_1 var_2 var_3 1 14.251923 14.8778
..
我遇到了以下逻辑问题: 在这个问题中,您需要将篮球运动员的真实姓名与他们的昵称进行匹配,并根据身高对篮球运动员进行排序。正常情况下,此问题需要您手动枚举不同的名称组合-昵称和名称-高度,直到根据以下条件没有矛盾为止。 我想知道这类问题是否可以通过使用诸如R之类的编程语言通过暴力来解决。 例如,下面的代码按身高列出了篮球运动员的所有可能组合: my_list = c("Bil
..
我正在使用R编程语言。我有一个既包含字符变量又包含数字变量的数据集--我正在尝试用&0&q;替换该数据中的所有NA和空值。对于连续变量,NA/Empty值应替换为数字0。对于系数变量,NA/Empty值应替换为系数0。 过去,我使用一个标准命令将所有NA替换为0(在下面的代码中,";df";表示包含数据的数据框): df[df == NA]
..
我正在使用R编程语言。 假设我有以下数据: my_data
..
我有一个具有未知列数的表,并且我需要合并某个点之后的所有列。请考虑以下事项: | A | B | C | D | E | |----|----|---|---|---| | 24 | 25 | 7 | | | | 12 | 3 | 4 | | | | 5 | 5 | 5 | 5 | | A-C列是已知的,并且其中的信息是正确的。但是,D列到N列(从D开始的未
..
如果我没有解释清楚, 很抱歉。 但我有以下数据集: mydata = data.frame (Id =c (1,1,1,1,1,1,1,1,2,2,2,2), Date = c("2001-01-31", "2001-02-13","2001-05-31", "2001-06-02","2018-01-31","2018-03-31","2018-07-31", "2019-04-04",
..
我正在使用R编程语言。最近,我读到了一种新的决策树算法,称为强化学习树(RLT),它被认为有可能将&Quot;Better&Quot;决策树匹配到数据集。此处提供了该库的文档:https://cran.r-project.org/web/packages/RLT/RLT.pdf 我尝试使用此库对(著名的)虹膜数据集运行分类决策树: library(RLT) data(iris) fit
..
我正在尝试根据不同列中的数据替换列的值,但这不起作用。以下是一些示例数据。 df
..
我用R编写了以下程序: 从名为&giraffe";data的数据框开始 对此数据的30%进行采样,并将其标记为 为此数据创建直方图,并将此直方图中采样的区域涂成一种颜色,其他行涂成另一种颜色 重复此过程100次,并制作此过程的动画 library(ggplot2) library(dplyr) library(gganimate) giraffe
..
我有一些数据,如下所示。2019年1月至2021年6月 date = seq(as.Date("2019/01/01"), by = "month", length.out = 29) productB = rep("B",29) productB = rep("B",29) productA = rep("A",29) productA = rep("A",29) subproduct
..
假设我有10个变量(num_var_1、num_var_2、num_var_3、num_var_4、num_var_5、factor_var_1、factor_var_2、factor_var_3、factor_var_4、factor_var_5): set.seed(123) num_var_1
..
我有这样的数据 category | Sub-category | Variable | 1990 | 1991 | 1992 C1 sc1 v1 1 2 3 v2 4 5 6
..
我正在使用R编程语言。假设我有以下两个表: table_1 = data.frame(id = c("123", "123", "125", "125"), id2 = c("11", "12", "14", "13"), date_1 = c("2010-01-31","2010-01-31", "2015-01-31", "2018-01-31" )) table_1$id = as.
..
我正在使用R编程语言。假设我有以下数据(";my_data";): set.seed(123) num_var_1
..
以下是我拥有的数据: am group v1 v2 v3 v4 1 2015-10-31 A 693 803 700 17% 2 2015-10-31 B 524 859 302 77% 3 2015-10-31 C 266 675 86 7% 4 2015-10-31 D 376 4
..