na相关内容
我有一个包含两列“a"和“b"的数据框,其中包含交替的缺失值(NA) a b狗小鼠 猫鸟 我想将它们“合并"/组合到一个看起来像这样的新列 c,即每行中的非 NA 元素被选中: c狗鼠猫鸟 我尝试了 merge 和 join,但都没有达到我想要的效果.也许是因为我没有要合并的 ID?对于整数,我会绕过这个并添加两列,但在我的情况下如何? 解决方案
..
我对 R 很陌生(从 SPSS 转过来).我在运行 Mavericks 的 Mac 上使用 RStudio.请用 2 个音节的词回答我的问题,因为这是我第一次真正尝试这样的事情.我已经完成了一些基本教程,可以使所有示例数据都能正常工作. 我有一个包含 64,000 行和大约 20 列的数据集.我想获得变量“hold_time"的平均值,但无论我尝试什么,我都会得到 NA 或 NA 以及一条警
..
我有一个数据框,其中包含带有整数,字符和数字的列.实际数据集比下面给出的例子大得多,但下面是一个还可以通过的小得多的模仿. 我试图遍历数据,并更改任何大于 mean +(3 *标准偏差)且小于 mean-(3 *标准偏差)的值仅数字列中的 NA 到 NA .如果一列包含整数或字符,则循环应跳过它并继续到下一列.此外,大多数列已经包含一些 NA 值,并且将包含很多在 mean +/-(3 *
..
我有一个带有一个时间列和2个变量的数据.(下面的示例) df
..
我正在减少代码的内存使用量.这段代码的目标是处理一些大数据集.如果相关的话,这些存储在Pandas数据框中. 在许多其他数据中,有一些小整数.由于它们包含一些缺失值(NA),Python默认将它们设置为float64类型.我试图将它们转换为较小的int格式(例如int8或int16),但由于不适用,因此出现了错误. 似乎有些新的整数类型(Int64)可以处理缺失的值,但对内存使用无济于
..
我很难理解这一点.我有一个长度为5的整数向量: x
..
编辑:输入 对此非常陌生. 我对此有类似的问题:分组依据,然后计算缺失的变量? 从该问题中获取输入数据: df1
..
我有一个非常简单的逻辑回归模型,该模型仅基于 Race 和 Sex 中的两个分类预测变量.首先,由于我有一些缺失的值,为了确保所有缺失的数据以 NA 的形式输入,我使用以下命令导入数据框: >mydata
..
这是一个令人困惑的问题.我正在为大型数据集计算线性模型,并使用"geom_text_repel"将方程式粘贴到图形上. 我多次成功运行脚本,但突然开始出现以下错误 : lm.fit(x,y,offset = offset,singular.ok = singular.ok,...)中的错误:0(非NA)例 这太疯狂了,因为我什么都没做.我已经广泛阅读了有关此问题的信息,但尚未找到解决方
..
我正在尝试使用facet_wrap在ggplot2中制作多边形地图.我的变量"crop"中有两个因子水平(大豆,玉米).但是,我得到了三个图:大豆,玉米和一个具有NA值的图.此外,前两个方面均不显示NA值- 这是我制作地图的代码: ggplot(study_area.map,aes(x = long,y = lat,group = group))+geom_polygon(aes(fil
..
我正在编写自己的函数来计算数据集中一列的均值,然后使用apply()应用它,但是它仅返回前几列的均值.下面是我的代码 mymean
..
我正在R中构建一个模型,同时不包括公式中的"office"列(有时会包含我预测的类的提示).我正在学习“培训"并正在预测“测试": >模型预测头(预测)[1]
..
我有一个数据集,我想以不同的方式替换不同列中的NA.以下是虚拟数据集和用于复制它的代码. test
..
如果条件满足,我试图用多个列中的NA替换各个值中的值. 这是一个示例数据集: 库(tidyverse)样本
..
我有一个数据集,其中包含一些我要替换为NA的未引用数据.在以下示例中,如果列rep1到rep4中的数据与ID列中的值之一不匹配,我想用NA替换该值.在这种情况下,x,y和z的值未在ID列中列出,因此应将其替换. 这是我之前在这里问过的类似问题:
..
我正在尝试研究Hadley Wickham的Data Science R,并绊倒了以下问题:“您如何使用ranging()将所有缺少的值从头开始排序?(提示:use is.na())" 我正在使用 nycflights13 包中包含的 flights 数据集.鉴于ranging()将所有未知值排序到数据帧的底部,我不确定如何对所有变量的缺失值做相反的处理.我意识到可以使用基本的R代码来回答这个问题
..
我想用NA替换数据框每列中的离群值. 例如,如果我们将离群值定义为离均值大于3个标准差的任何值,我可以使用以下代码实现此每个变量. 我希望在一个调用中对 df 的所有列执行相同的操作,而不是单独指定每个列.关于如何执行此操作的任何指示? 谢谢! 库(dplyr)数据("iris")df
..
我有以下数据集: ID值abc 1abc NAabc 2防御5定义1防御4 我知道如何识别包含NA的行的ID.我想做的是删除包含ID的所有行(如果一行包含NA).在这种情况下:abc的一行显示一个NA,因此应删除ID = abc的所有行,以便数据框如下所示: ID值防御5定义1防御4 在此先感谢您的帮助. 欢呼 解决方案 您可以使用 ID 的否定的! %in%!拥有
..
如何获取 fread()以将包括字符变量在内的所有变量的“""设置为 NA ? 我正在导入一个.csv文件,其中缺少的值是空字符串(“"" ;没有空格).我想将“" 解释为缺少值 NA ,并尝试使用"na.strings ="".没有成功: data
..
我有一个很大的data.table对象(1M行和220列),我想用NA替换所有空格('').我在此 Post 中找到了解决方案,但是对于我的数据表来说,它的运行速度非常慢(耗时已超过15分钟)来自另一篇文章的示例: data = data.frame(cats = rep(c('','','喵'),1e6),dogs = rep(c("woof",“",NA),1e6))system.time
..