lapply相关内容
我一直在尝试提高某些代码的速度.我已经删除了所有循环,正在使用矢量,并且几乎所有内容都经过了流水线处理.我已经为代码的每次迭代计时,随着迭代次数的增加,它似乎正在变慢. ###开始的迭代用户系统已用完0.03 0.00 0.03用户系统已用完0.03 0.00 0.04用户系统已用完0.03 0.00 0.03用户系统已用完0.04 0.00 0.05###结束迭代用户系统已用完3.06 0.
..
我有以下庞大的数据框: V1 V2 V3 V4A E R 12A R T 18T 44Y11B E R 22B R T 53T 11Y 153 我想做的是从 V4 中获取每对(V1,V2) 的离群值 这很容易用2个for循环基于 V1 和 V2 的唯一值以及每个回合的 subset 来取向量每个子集的V4版本,并使用 outlier 包的任何功能获取离群值,但是问题出在速度上.
..
这是我要做什么的要点: 我有2个数据帧: x(id是唯一的) id时间戳282462839 2012-12-05 10:55:00282462992 2012-12-05 12:08:00282462740 2012-12-05 12:13:00282462999 2012-12-05 12:48:00 y(id不是唯一的) id value1 value2282462839
..
我有一个数据框: df = data.frame(x1 = rnorm(50),x2 = rnorm(50),x3 = rnorm(50),x4 = rnorm(50)) 我想将每个变量与所有其他变量进行回归,例如: fit1
..
我想从大型数据框中生成数百个连续数据的箱线图,并按“年"因子进行分层.我首先从原始数据框架创建一个列表,该列表包含每个因变量和年份. 这是一个类似于我的示例数据集: l
..
这是 这将产生一个像这样的表: cname1 cname2 cname3 V4 V5dbf2005 factor factor数字NULL NULLdbf2006数值因子NULL因子数值 因此,他们没有给出2006年的实际列名,而是使用通用的"V"加上出现的列号.如何获取表以包含dbf2006中的列名? 解决方案 我使用 janitor 包中的 compare_df_cols
..
我要“升级"我的代码通过使用lapply函数替换使用for循环的mass-import.使用 lapply(list.files(),read.csv)后,我得到了一个数据帧列表.问题是,数据有点混乱,并且在一个特定的单元格中只提到了一些事情(例如参与者的性别).当我使用for循环时,这不是问题,因为我只能引用特定的单元格.当我使用时: for(x in list.files()){临时
..
我试图遍历具有两个数据帧的列表,并且想要将每个数据帧中的列2的类从factor更改为data.我可以使用for循环解决此问题,但是我想学习如何使用lapply做到这一点. tom
..
我有一个包含11个数据帧的 list ,每个数据帧的名称描述了其来源.本质上,我想添加一个“源"列表中每个数据框的一列,其中包含每个单元格中数据框的名称. 所有这些都是为了使数据可以向下游传递到CRAN程序包中,该程序包不能很好地与列表配合使用. 我尝试使用 lapply 并查看了其他一些答案,但似乎都不适合. 非常感谢您的帮助, 谢谢 ##一些玩具数据p1 <-c
..
很抱歉出现一般性问题.我正在寻找用于整理数据文件夹的指针,其中有许多.txt文件.它们都具有不同的标题,并且对于绝大多数文件而言,文件具有相同的维度,即列号相同.但是,麻烦的是某些文件,尽管具有相同的列数,但具有不同的列名.也就是说,在那些文件中,还测量了其他一些变量. 我想清除这些文件,而不能简单地通过比较列号来做到.有什么方法可以传递列名并检查目录中有该列的文件,以便可以将它们删除到另一
..
我正在尝试在Google驱动器中合并 .xls 文件的列表.现在,我已经设法创建了我需要的所有文件的列表,但是由于某种原因,我仍然无法合并它们,这是到目前为止的代码: 库(googledrive)inputfiles
..
我有气候数据,我正在尝试用 NA 替换异常值.我之所以不使用 boxplot(x)$ out 是因为我有一定范围的值可以用来计算离群值. temp_range
..
此帖子类似于我的其他帖子 假设我有4个矩阵: x1
..
我有一个包含许多数据子集的数据帧列表(470ish).我正在尝试对每个变量进行回归并将回归系数添加到数据框.数据框将包含每个子组上所有因变量的系数.我尝试使用for循环进行迭代,但显然这不是正确的方法.我认为解决方案与lapply有关? 用于(i在ListOfTraining中){lm(JOB_VOLUME〜FEB + MAR + APR + MAY + JUN + JUL + AUG + SE
..
我有多个数据框(在130个观察点处,不同持续时间的温度变化),并且想要通过将以下代码应用于每个数据框来生成所有数据的月平均值-然后将结果放入一个数据框.我一直在尝试使用for循环执行此操作,但没有成功.我对R还是比较陌生,如果有人可以帮助我解决这个问题,我会非常感激. 这是数据框的一瞥: head(maxT2016 [,1:5])X X0 X1 X2 X31 20160101 26.08
..
我正在将非结构化数据转换为长格式,并且需要创建一个ID(分组)变量.我想基于另一个变量中包含的值集分配一个ID变量.更具体地说,请考虑以下数据集. set.seed(1234);x.1
..
我正在尝试在R中运行以下代码: player1_html = lapply(player1,readLines) 其中,player1是由15个字符向量组成的字符数组,其中包含要读取的不同页面的url.我面临的问题是某些页面显示404错误,由于该错误而导致程序中断并显示以下错误: 文件中的错误(con,"r"):无法打开连接 我想问一下是否有一种方法可以通过忽略产生错误的链接来处理l
..
我试图在这里找到类似的问题,但认为创建一个新问题可能会有所帮助. 我有相对较大的数据集(数百个站点的每日天气数据)我做了一些滑动窗口平均计算,然后得到了中间输出. 11列的 10481441行的 数据帧,但我的行名由带有可识别前缀的一系列数字组成. 例如 X1.1X1.2X1.3...X1.11659X2.1X2.2X2.3...X2.11659X3.1...X899.11
..
我在下面有 nodes 和 edges 个数据框,然后创建一个图形对象 gph .之后,我创建一个名为 asp 的 igraph.vs 对象的列表,并带有所有简单路径.然后,我希望能够使用 for 循环或 lappy()来创建与列表长度一样多的数据帧,并使用每个 igraph.vs 对象,作为 nodes 数据集,并基于这些 nodes 数据集创建尽可能多的相对 edges 数据集.然后,我使用
..
我有500万个序列(具体来说是探针),如下所示.我需要从每个字符串中提取名称. 这里的名称是1007_s_at:123:381、10073_s_at:128:385等等. 我正在使用lapply函数,但是这花费了太多时间.我还有其他几个类似的文件.您是否可以提出一种更快的方法来做到这一点? nm = c("probe:HG-Focus:1007_s_at:123:381; Inte
..