data-manipulation相关内容

可以将来自多个.csv文件(存储在同一文件夹中)的一列数据编译成一列吗?

我想从几个(批次!)中取一些专栏并构建一个新的.csv文件,其中所有列都堆叠在一起。所有.csv文件都在一个文件夹中,除了一列数据外几乎相同。大多数列需要保持完全相同,但需要从其中一个列的标题中的名称生成一个新列(这是唯一将更改的标题),我想删除一些不需要的数据列。以下是我希望发生但仅简化为两个数据集的情况的示例: Data set 1 X date distance.c ..
发布时间:2022-07-19 12:34:31 其他开发

在R中将列表列表展平为数据帧时丢失重复的列名

这种将列表展平为数据帧的问题已经被问了几次,但我找不到一个解决方案来解决我的特定问题。下面我举了一个小例子。一般来说,当在R中使用httr从API获取数据时,我用来获取数据的大多数数据API都以类似的嵌套列表格式返回数据,如下所示: nested_list = list( list( name = 'joe', match = 13, team = list( ..
发布时间:2022-05-07 18:50:50 其他开发

R:函数仅生成1行数据

我正在与R.合作。在上一篇文章(R: Keeping the 5 Biggest Rows in a Table)中,我生成了一些随机数据,并编写了以下代码,该代码循环执行一系列数据操作步骤,并生成一个包含结果的表(";Final_Results&Quot;): #load library library(dplyr) library(data.table) set.se ..
发布时间:2022-05-07 18:45:42 其他开发

R:逻辑条件不受尊重

我正在使用R编程语言。我正在尝试构建一个执行以下操作的循环: 第一步:继续生成两个随机数,直到两个随机数都大于12 第二步:跟踪在第一步完成之前需要生成多少随机数 步骤3:重复步骤1和步骤2 100次 因为我不知道如何在满足某个条件之前一直生成随机数,所以我尝试生成大量随机数,希望满足该条件(可能有更好的方法来编写此内容): results ..
发布时间:2022-05-07 18:28:58 其他开发

SAS:模糊连接

我在SAS中运行以下SQL查询: proc sql; create table my_table as select a.*, b.* from table_a a inner join table_b b on (a.date_1 between b.date_2 and b.date_3 and a.id1 = b.id1) or a.id2 = b.id2; quit; 我的问题 ..
发布时间:2022-05-07 18:18:51 其他开发

R:记录函数的索引迭代

我正在使用R编程语言。在上一个问题(R: Creating a Function to Randomly Replace Data from a Data Frame)中,我学习了如何根据不同的条件将数据集中的行随机替换为0: 第1步:数据集有10个变量-在第1步中,从这些变量中随机选择(&q;n&q;必须小于10)。 第2步:对于上述变量,如果它们是因数,则为每个因数变量随机选择级别 ..
发布时间:2022-05-07 18:11:24 其他开发

R:在表中保留最大的5行

我正在使用R编程语言。我创建了一些随机数据,然后编写了以下程序,该程序循环执行一系列数据操作步骤: #load library library(dplyr) library(data.table) set.seed(123) # create some data for this example a1 = rnorm(1000,100,10) b1 = rnorm(1000,1 ..
发布时间:2022-05-07 16:53:27 其他开发