na相关内容
我有一个类似于这一个的问题,但我的数据集有点大:50列,1列为UID,其他列为 TRUE 或 NA ,我想将所有 NA 更改为 FALSE ,但我不想使用显式循环。 可以 plyr 做窍门吗?谢谢。 更新#1 感谢您的快速回复,但如果我的数据集如下所示: / p> df
..
我正在编写一个函数,它需要检查(和哪个!)列(变量)都缺少值( NA , )。以下是函数的片段: test1
..
可能重复: 在R中设置NA为0 我有具有 NA 值的列的data.frame。我想用 0 或任何其他值替换 NA 。我尝试了很多线程和方法,但没有给我结果。我尝试了以下方法。 a $ x [a $ x == NA] a [,c(“x”)]
..
我看起来像... (没有行)的数据框双方为NA,表按日期排序)。 日期XY 2012-07-05 00 :01:19 0.0122 NA 2012-07-05 03:19:34 0.0121 NA 2012-07-05 03:19:56 0.0121 0.027 2012-07-05 03:20 :31 0.0121 NA 2012-07-05 04:19:56 0.0
..
这是我第一个关于stackoverflow的问题,所以如果已经得到回答,我的道歉,请让我知道在哪里看。 两个帖子,并认为他们可能回答我的问题,虽然我很努力地看到如何: 1)创建一个功能来替换一个data.frame与另一个值 就是说,我试图通过引用另一个不同的数据帧来替换一个数据帧中的NAs(较短)长度,并从“B”列中拉取替换值,其中每个数据框中的列“A”的值匹配。 我已经
..
我有一个这样的数据框架: 姓名职务价值 a 1 0.2 a 3 0.4 a 4 0.3 b 1 0.5 b 2 0.4 b 5 0.3 c 2 0.3 c 3 0.4 c 5 0.1 d 1 0.2 d 2 0.4 d 3 0.5 我想让它的位置一直从1到5为每个名称,并填写NAs值如下: 姓名职务价值 a 1 0.2 a 2 NA a
..
我有一个数据帧,其中一些值是NA。我想删除这些列。 我的数据框看起来像这样 v1 v2 1 1 NA 2 1 1 3 2 2 4 1 1 5 2 2 6 1 NA 我试图估计col的意思,选择列表示!= NA。我试过这个声明,它不起作用。 data = subset(Itun,select = c(is.na(colMeans It
..
我有一个data.frame和一些列有NA值。我想用零代替NAs。我如何做? 解决方案 请参阅我在gsk3答案中的评论。一个简单的例子: > m d
..
我想用 NA data.table / index.html“rel =”nofollow“> data.table ,并使用 data.table 。我有一个解决方案,但它比 na.locf 慢得多: library(data.table) library(zoo) library(microbenchmark) f1
..
我无法弄清楚如何在R中使用is.na(x)类型的函数来处理无限数字数据表,或者每列显示有多少个Inf。colSums(is.infinite(x)) 我使用以下示例数据集: DT abc 1:Inf a Inf 2:1 b 5 3:Inf c NA colSums(is.na(DT)) abc 0 0 1 colSums(is.infinite(DT)) i
..
我在试图用 data.table 包重写旧的(慢)代码,找出使用使用data.table应用。 我有一个data.table具有多个id列,然后多个列具有宽格式的剂量响应数据。我需要归纳答案,因为不是所有的data.tables将有相同数量的剂量反应列。为了简单起见,我认为以下data.table解决了这个问题: library(data.table) 库) set.seed(12
..
我见过一个解决方案,但不能让它为组工作 (在时间序列中只填充有限的数字),并认为还有一个更简洁的方法来做到这一点? 说我有以下dt: dt
..
我有一个包含一些组的 data.table 。我操作每个组,一些组返回数字,其他返回 NA 。由于某些原因 data.table 无法将所有内容放回一起。这是一个错误还是我误会?这是一个例子: dtb f dtb [,f(a),by = a] 错误在`[.data.table`(dtb,,f(a),by = a)中: j的列不会对每个组求值为一致类型:组9的结果具有列1类型'逻辑
..
计算两个数据表的总和时, NA + n = NA 。 code>> dt1 & dt1 名称1 2 1:Joe 0 3 2:Ann NA NA > dt2 & dt2 名称1 2 1:Joe 0 2 2:Ann NA 3 > dtsum > dtsum 名称1 2 1:Joe 0 5 2:Ann NA NA 我不想用0代替所有NA。我想要的
..
让DT为数据表: DT V2 = sample(10), ... V9 = sample(10),) $ b b 有这样更好/更简单的方法来做多列recode / sub-assign: DT [V1 == 1 | V1 == 7,V1:= NA] DT [V2 == 1 | V2 == 7,V2:= NA] DT [V3 == 1 | V3 == 7
..
如何选择数据表中主键中缺少值的所有行。 DT = data.table(x = rep(c(“a”,“b”,NA),each = 3),y = c(1,3,6),v = 1:9) setkey ,x) 选择特定值很容易 DT [“a”,] 对于缺少的值似乎需要一个向量搜索。不能使用二进制搜索。我是否正确? DT [NA,]#不工作
..
有很多关于替换NA值的帖子。我知道可以用下面的表/框架替换NAs: x [is.na(x) ] 但是,如果我只想限制某些列让我们给你一个例子。 首先,我们从一个数据集开始。 set.seed(1234) x b = sample 1,2,NA),10,replace = T), c = sample(c(1:5,NA),10,replace = T))
..
这可能是一个初学者的问题,并有一个相当简单的修复,但我一直在它一段时间,似乎无法确定。我有高频数据,有大约500,000行和62列。我想使用fread()使阅读更有效率,但问题是不是所有的行都是相同的长度。 这是我使用read.csv读取时的输出: > df >日期时间Seq BP1 BQ1 BO1 AP1 AQ1 AO1 BP2 BQ2 BO2 AP2 AQ2 AO2 BP3 BQ3
..
我们有一个来自CSV文件的数据框。数据框 DF 具有包含观察值的列和包含测量日期的列( VaR2 )已采取。如果未记录日期,则CSV文件包含缺少数据的值 NA 。 Var1 Var2 10 2010/01/01 20 NA 30 2010/03/01 我们想使用subset命令定义一个新的数据框架 new_DF ,这样它只包含有 NA'的值( VaR2 )。在
..
有人可以解释为什么我得到不同的答案使用聚合函数来计数组的缺失值?此外,是否有更好的方法来计算组使用原生R函数的缺失值? DF DF aggregate(X〜YEAR,data = DF,function(x){sum(is.na(x))}) with(DF,aggregate X,list(YEAR),function(x){sum(is.na(x))})) aggreg
..