lapply相关内容

R代码随着迭代次数的增加而变慢

我一直在尝试提高某些代码的速度.我已经删除了所有循环,正在使用矢量,并且几乎所有内容都经过了流水线处理.我已经为代码的每次迭代计时,随着迭代次数的增加,它似乎正在变慢. ###开始的迭代用户系统已用完0.03 0.00 0.03用户系统已用完0.03 0.00 0.04用户系统已用完0.03 0.00 0.03用户系统已用完0.04 0.00 0.05###结束迭代用户系统已用完3.06 0. ..
发布时间:2021-05-28 20:23:32 其他开发

用lapply代替for循环

我有以下庞大的数据框: V1 V2 V3 V4A E R 12A R T 18T 44Y11B E R 22B R T 53T 11Y 153 我想做的是从 V4 中获取每对(V1,V2) 的离群值 这很容易用2个for循环基于 V1 和 V2 的唯一值以及每个回合的 subset 来取向量每个子集的V4版本,并使用 outlier 包的任何功能获取离群值,但是问题出在速度上. ..
发布时间:2021-05-28 20:23:27 其他开发

当生成一个表以交叉引用R中多个dbf的列名和数据类型时,如何重现所有列名

这是 这将产生一个像这样的表: cname1 cname2 cname3 V4 V5dbf2005 factor factor数字NULL NULLdbf2006数值因子NULL因子数值 因此,他们没有给出2006年的实际列名,而是使用通用的"V"加上出现的列号.如何获取表以包含dbf2006中的列名? 解决方案 我使用 janitor 包中的 compare_df_cols ..
发布时间:2021-05-28 20:23:09 其他开发

如何处理lapply中的特定单元格?

我要“升级"我的代码通过使用lapply函数替换使用for循环的mass-import.使用 lapply(list.files(),read.csv)后,我得到了一个数据帧列表.问题是,数据有点混乱,并且在一个特定的单元格中只提到了一些事情(例如参与者的性别).当我使用for循环时,这不是问题,因为我只能引用特定的单元格.当我使用时: for(x in list.files()){临时 ..
发布时间:2021-05-28 20:23:06 其他开发

R:根据列表元素名称创建新的数据框变量

我有一个包含11个数据帧的 list ,每个数据帧的名称描述了其来源.本质上,我想添加一个“源"列表中每个数据框的一列,其中包含每个单元格中数据框的名称. 所有这些都是为了使数据可以向下游传递到CRAN程序包中,该程序包不能很好地与列表配合使用. 我尝试使用 lapply 并查看了其他一些答案,但似乎都不适合. 非常感谢您的帮助, 谢谢 ##一些玩具数据p1 <-c ..
发布时间:2021-05-28 20:23:00 其他开发

R:如何根据匹配的特定列标题查找文件夹中的选择文件

很抱歉出现一般性问题.我正在寻找用于整理数据文件夹的指针,其中有许多.txt文件.它们都具有不同的标题,并且对于绝大多数文件而言,文件具有相同的维度,即列号相同.但是,麻烦的是某些文件,尽管具有相同的列数,但具有不同的列名.也就是说,在那些文件中,还测量了其他一些变量. 我想清除这些文件,而不能简单地通过比较列号来做到.有什么方法可以传递列名并检查目录中有该列的文件,以便可以将它们删除到另一 ..
发布时间:2021-05-28 20:22:57 其他开发

在R中合并多个.xls文件

我正在尝试在Google驱动器中合并 .xls 文件的列表.现在,我已经设法创建了我需要的所有文件的列表,但是由于某种原因,我仍然无法合并它们,这是到目前为止的代码: 库(googledrive)inputfiles ..
发布时间:2021-05-28 20:22:54 其他开发

R向数据框添加回归系数

我有一个包含许多数据子集的数据帧列表(470ish).我正在尝试对每个变量进行回归并将回归系数添加到数据框.数据框将包含每个子组上所有因变量的系数.我尝试使用for循环进行迭代,但显然这不是正确的方法.我认为解决方案与lapply有关? 用于(i在ListOfTraining中){lm(JOB_VOLUME〜FEB + MAR + APR + MAY + JUN + JUL + AUG + SE ..
发布时间:2021-05-28 20:22:45 其他开发

一组在多个数据帧上的函数,并将输出合并到R中

我有多个数据框(在130个观察点处,不同持续时间的温度变化),并且想要通过将以下代码应用于每个数据框来生成所有数据的月平均值-然后将结果放入一个数据框.我一直在尝试使用for循环执行此操作,但没有成功.我对R还是比较陌生,如果有人可以帮助我解决这个问题,我会非常感激. 这是数据框的一瞥: head(maxT2016 [,1:5])X X0 X1 X2 X31 20160101 26.08 ..
发布时间:2021-05-28 20:22:42 其他开发

带索引的for循环的替代方法-R

我正在将非结构化数据转换为长格式,并且需要创建一个ID(分组)变量.我想基于另一个变量中包含的值集分配一个ID变量.更具体地说,请考虑以下数据集. set.seed(1234);x.1 ..
发布时间:2021-05-28 20:22:39 其他开发

Lapply的错误处理

我正在尝试在R中运行以下代码: player1_html = lapply(player1,readLines) 其中,player1是由15个字符向量组成的字符数组,其中包含要读取的不同页面的url.我面临的问题是某些页面显示404错误,由于该错误而导致程序中断并显示以下错误: 文件中的错误(con,"r"):无法打开连接 我想问一下是否有一种方法可以通过忽略产生错误的链接来处理l ..
发布时间:2021-05-28 20:22:36 其他开发

data.frame colmn在第n行间隔处的平均值

我试图在这里找到类似的问题,但认为创建一个新问题可能会有所帮助. 我有相对较大的数据集(数百个站点的每日天气数据)我做了一些滑动窗口平均计算,然后得到了中间输出. 11列的 10481441行的 数据帧,但我的行名由带有可识别前缀的一系列数字组成. 例如 X1.1X1.2X1.3...X1.11659X2.1X2.2X2.3...X2.11659X3.1...X899.11 ..
发布时间:2021-05-28 20:22:33 其他开发

使用lapply或loop重复基于多个数据帧创建.png文件的过程

我在下面有 nodes 和 edges 个数据框,然后创建一个图形对象 gph .之后,我创建一个名为 asp 的 igraph.vs 对象的列表,并带有所有简单路径.然后,我希望能够使用 for 循环或 lappy()来创建与列表长度一样多的数据帧,并使用每个 igraph.vs 对象,作为 nodes 数据集,并基于这些 nodes 数据集创建尽可能多的相对 edges 数据集.然后,我使用 ..
发布时间:2021-05-28 20:22:30 其他开发

R在R中提取字符串的一部分

我有500万个序列(具体来说是探针),如下所示.我需要从每个字符串中提取名称. 这里的名称是1007_s_at:123:381、10073_s_at:128:385等等. 我正在使用lapply函数,但是这花费了太多时间.我还有其他几个类似的文件.您是否可以提出一种更快的方法来做到这一点? nm = c("probe:HG-Focus:1007_s_at:123:381; Inte ..
发布时间:2021-05-28 20:22:26 其他开发