data-manipulation相关内容
我想从几个(批次!)中取一些专栏并构建一个新的.csv文件,其中所有列都堆叠在一起。所有.csv文件都在一个文件夹中,除了一列数据外几乎相同。大多数列需要保持完全相同,但需要从其中一个列的标题中的名称生成一个新列(这是唯一将更改的标题),我想删除一些不需要的数据列。以下是我希望发生但仅简化为两个数据集的情况的示例: Data set 1 X date distance.c
..
我正在使用R编程语言。我在服务器上有以下表格: age=18:29 height=c(76.1,77,78.1,78.2,78.8,79.7,79.9,81.1,81.2,81.8,82.8,83.5) gender=c("M","F","M","M","F","F","M","M","F","M","F","M") testframe = data.frame(age=age,height
..
这种将列表展平为数据帧的问题已经被问了几次,但我找不到一个解决方案来解决我的特定问题。下面我举了一个小例子。一般来说,当在R中使用httr从API获取数据时,我用来获取数据的大多数数据API都以类似的嵌套列表格式返回数据,如下所示: nested_list = list( list( name = 'joe', match = 13, team = list(
..
我正在与R.合作。在上一篇文章(R: Keeping the 5 Biggest Rows in a Table)中,我生成了一些随机数据,并编写了以下代码,该代码循环执行一系列数据操作步骤,并生成一个包含结果的表(";Final_Results&Quot;): #load library library(dplyr) library(data.table) set.se
..
我正在尝试将for循环转换为函数。预期结果是Summ.Stats。如有任何帮助,请以b函数格式获取预期结果(Summ.Stats)。 CN = colnames(mtcars);CN var
..
我正在使用R编程语言。我正在尝试构建一个执行以下操作的循环: 第一步:继续生成两个随机数,直到两个随机数都大于12 第二步:跟踪在第一步完成之前需要生成多少随机数 步骤3:重复步骤1和步骤2 100次 因为我不知道如何在满足某个条件之前一直生成随机数,所以我尝试生成大量随机数,希望满足该条件(可能有更好的方法来编写此内容): results
..
我在SAS中运行以下SQL查询: proc sql; create table my_table as select a.*, b.* from table_a a inner join table_b b on (a.date_1 between b.date_2 and b.date_3 and a.id1 = b.id1) or a.id2 = b.id2; quit; 我的问题
..
我正在使用R编程语言。在上一个问题(R: Creating a Function to Randomly Replace Data from a Data Frame)中,我学习了如何根据不同的条件将数据集中的行随机替换为0: 第1步:数据集有10个变量-在第1步中,从这些变量中随机选择(&q;n&q;必须小于10)。 第2步:对于上述变量,如果它们是因数,则为每个因数变量随机选择级别
..
我正在使用R编程语言。 假设我有10个变量(num_var_1、num_var_2、num_var_3、num_var_4、num_var_5、factor_var_1、factor_var_2、factor_var_3、factor_var_4、factor_var_5): num_var_1
..
我正在使用R编程语言。假设我有以下数据框: age=18:29 height=c(76.1,77,78.1,78.2,78.8,79.7,79.9,81.1,81.2,81.8,82.8,83.5) gender=c("M","F","M","M","F","F","M","M","F","M","F","M") testframe = data.frame(age=age,height=h
..
我要设置我的自定义摘要统计信息函数,如果列是一个因素,我希望看到prop.table而不是摘要统计信息。 set.seed(123) df
..
我使用的是R。对于我生成的这个随机数据集,我创建了以下联想表: library(memisc) library(dplyr) set.seed(123) v1
..
假设我有以下三个图(在R中): p1 = hist(rnorm(1000,1,1), 10000) p2 = hist(rnorm(1000,1,1), 10000) p3 = hist(rnorm(1000,1,1), 10000) 有没有办法将这些内容制作成 gif";? 例如: library(gifski) gif_file
..
我有一个唯一的数据帧df: name val_1 val_2 val_3 val_4 AAA 1 2 3 11 BBB 2 3 5 9 CCC 6
..
我在R工作 我有以下5个数据集(Data_1、Data_2、Data_3、Data_4、Data_5): v1
..
在上一个问题(R: Adding Two Series to a Graph)中,我学习了如何绘制以下图表: library(ggplot2) library(dplyr) my_data = data.frame(var_1_col = "red", var_2_col = "green", var_1 = rnorm(8,10,10), var_2 = rnorm(8,5,1), na
..
假设我有以下列表: library(combinat) d = permn(c("a", "b", "c")) 如下所示: [[1]] [1] "a" "b" "c" [[2]] [1] "a" "c" "b" [[3]] [1] "c" "a" "b" [[4]] [1] "c" "b" "a" [[5]] [1] "b" "c" "a" [[6]] [1] "b" "
..
我使用的是R编程语言。我创建了一些数据和以下函数: #load library library(dplyr) set.seed(123) # data a1 = rnorm(1000,100,10) b1 = rnorm(1000,100,5) c1 = sample.int(1000, 1000, replace = TRUE) train_data = data.fra
..
我正在使用R编程语言。我创建了一些随机数据,然后编写了以下程序,该程序循环执行一系列数据操作步骤: #load library library(dplyr) library(data.table) set.seed(123) # create some data for this example a1 = rnorm(1000,100,10) b1 = rnorm(1000,1
..
由于time变量(不平衡面板数据): ,我想合并不同长度的长格式数据帧: set.seed(63) #function to create a data frame that includes id, time and x func1
..