apply相关内容
我有一个数据框,其中有一个维列和4个值列。如何对列进行子集,以使每个记录的所有4列都小于给定的x?我知道我可以手动使用子集并指定每列的条件,但是有没有办法使用可能的应用功能? 以下是一个示例数据框。例如让我们说x是0.7。在这种情况下,我想删除任何行,该列的任何列超过0.7)。 拉链ABC DEF GHI JKL 1 1 0.8 0.6 0.1 0.6 2 2 0.1 0.3 0.
..
我希望对我正在工作的数据集执行“最后观察结束”,在其末尾缺少值。 这是一个简单的代码来做(问题之后): LOCF
..
我有一个数据帧,我想应用一个取三列值的函数,并计算三个值之间的最小值。 #dataset df
..
我无法自己解决这个问题: 数据框具有任意的属性作为列和每行表示一个数据集。 问题是: 如何摆脱列对于 ALL 行,值为NA ? 解决方案 尝试: df
..
我正在尝试从R中的数据帧转到列表结构(而且我从技术上知道数据帧是一个列表)。我有一个包含参考化学品及其机制的数据框架不同的目标。例如,雌激素是雌激素受体激动剂。我想要的是将数据框转换为列表,因为我厌倦了输入如下的东西: refchem $ chemical_id [refchem $ target ==“AR”& refchem $ mechanism ==“Agonist”]
..
我有一个数据框: x
..
如何使用应用或相关函数创建一个新的数据帧,其中包含非常大的数据帧中每对列的行平均值的结果? 我有一个对大量样本进行重复测量的 n 的仪器,其中每个单次测量是矢量(所有测量都是相同的长度矢量)。我想计算每个样本的所有重复测量的平均值(和其他统计数据)。这意味着我需要将 n 连续列组合在一起,并进行逐行计算。 对于一个简单的例子,对两个样本进行三次重复测量,我最终如何得到一个数据帧,它有两
..
在pandas应用功能上有一些问题,当使用具有以下数据框架的多个列 df = DataFrame({ 'a':np.random.randn(6), 'b':['foo','bar'] * 3, 'c':np.random.randn(6)} ) 和以下功能 def my_test(a,b): return a%b 当我尝试应用此功能时:
..
我有一个数据框,例如: 姓名日工资 1 Ann 1 100 2 Ann 1 150 3 Ann 2 200 4 Ann 3 150 5 Bob 1 100 6 Bob 1 200 7 Bob 1 150 8 Bob 2 100 对于每个唯一的名称/日对,我想计算一个范围总数,例如“此人的当前或次日工资大于175的次数”。 我现在可
..
我在试图用 data.table 包重写旧的(慢)代码,找出使用使用data.table应用。 我有一个data.table具有多个id列,然后多个列具有宽格式的剂量响应数据。我需要归纳答案,因为不是所有的data.tables将有相同数量的剂量反应列。为了简单起见,我认为以下data.table解决了这个问题: library(data.table) 库) set.seed(12
..
我有一个22k记录和6列的营销数据的数据框架,其中2个是感兴趣的。 变量 FO.variable 以下是一个包含数据框示例的输出输出的链接: http:// dpaste .com / 2SJ6DPX 请告诉我是否有更好的分享数据的方式。 所有我想做的是创建一个额外的二进制保持列,应该是: 1如果FO.variable在变量 如果FO.Variable不在变量
..
我是新的data.tables如此抱歉,如果这是一个非常基本的问题。 我听说data.tables在处理大量数据时显着提高了计算时间,所以想看看data.table是否能够帮助加快滚动功能。 如果我们有一些单变量数据 xts.obj
..
有没有办法利用多线程的计算使用 data.table 在R?例如,假设我有以下 data.table : dtb
..
我有下表: 日期国家类价值 6/1/2010美国A 45 6/1/2010加拿大A 23 6/1/2010巴西B 65 9/1/2010美国B 47 9/1/2010加拿大A 98 9/1/2010巴西B 25 12/1/2010美国B 14 12/1/2010加拿大A 79 12/1/2010巴西A 23 3 / 1/2011 USA A 84 3
..
我在R中做了经典的拆分 - 应用 - 重组事件。我的数据集是一段时间内的一群公司。我正在做的是为每个公司运行回归,并返回残差,因此,我不是由公司聚合。 plyr 是伟大的,但它需要一个非常非常长的时间运行,当企业数量庞大。有没有办法用 data.table ? 示例数据: dte,id,val1,val2 2001-10-02,1,10,25 2001-10-03,1 ,11
..
我使用了很多固定宽度的文件(即没有分隔字符),我需要读入R.因此,通常有一个定义的列宽度来解析字符串变量。我可以使用 read.fwf 读取数据没有问题。但是,对于大型文件,这可能需要长时间。对于最近的数据集,花费800秒读取数据集中的约500,000行和143个变量。 seer9
..
我想将一个函数应用于Java集合,在这种特殊情况下是一个映射。有一个很好的方法来做到这一点吗?我有一个地图,并希望只是对地图中的所有值运行trim(),并让地图反映更新。 解决方案 使用Java 8的lambdas,这是一个线程: map.replaceAll((k,v) - > v.trim()); 为了历史,这里有一个没有lambdas的版本: pu
..
我试图传递一些包含节点列表的向量到clojure中的函数如果我要键入变量,但我不知道如何从一个时间每个向量传递单个变量的函数工作。 (def ItemPickUp [:a1:Mail]) (def ItemDestinations [:Storage:a1]) (def Robot {[ItemPickUp] [ItemDestinations]}) (defn shortest
..
我需要将许多列数字转换为因子类型。 示例表: df 我尝试了apply: cols class(df $ A) [1]“character”
..
我坚持:)。我有两个层次结构,每个级别有子节点。 该目标是利用这种结构来填充GUI树。我试图访问的变体成员的子节点的通用方式。继code不能编译,使用vs2013。我将AP preciate了援助之手和/或建议 对设计变更。 的#include“stdafx.h中” #包括LT&;内存和GT; #包括LT&;串GT; #包括LT&;矢量> #包括LT&;升压/ variant.hpp&
..