subset相关内容

(R)[]/subset()返回空数据框

我有一个很大的数据集,它看起来像这样,还有几十万个条目,另存为data: Group1 dtm_Flight_Date Departure Arrival str_Fare_Category_Ident 1 8P104 06/11/2010 9:05 YYJ YVR B 2 ..
发布时间:2022-08-06 17:10:27 其他开发

从具有重复元素的数组中随机找到一个组合,其和等于n

如何从具有重复元素的array中随机找到一个组合,其总和等于n。 示例 array为[1, 2, 2, 3]和n为3 答案为1+2、1+2、3 如果randomSubsetSum(array, n)为解决方案,则randomSubsetSum([1,2,2,3], 3)将返回1+2、1+2、3之一。注意:1+2出现的频率是3的两倍 真实场景:从题库中随机选择试题 我发现了一 ..
发布时间:2022-08-06 16:59:41 Java开发

检查数据中的所有值是否都是整数。框列是子集伪变量,也就是列中的所有值都是真的吗?

我想知道是否有更简单的方法来设置数据框的整型列。 我的目标是在不触及纯整数列(在我的例子中包含0或1)的情况下修改data.Frame中的数字列。整数列最初是因子级别,变成了虚拟变量,应该保持原样。所以我想暂时删除它们。 为了区分数字列和整型列,我使用了此处的OP版本(Check if the number is integer)。 但is.wholenumber返回一个TRUE ..
发布时间:2022-07-01 09:14:52 其他开发

根据选定的变量/列名称过滤R数据框并子设置R数据框

我正在尝试子集一个包含许多变量/列名的大型数据集,比如ax1、ax2、ax3、ax4、ax5、...、ax20、bx1...bx20、zx1...zx20。例如,假设我要获取的子集数据位于变量ax3、ax5、ax11、ax19、...、bx3、bx5、cx11、cx19、...、zx3、zx5、zx11、zx19上。 我在R中尝试了以下代码,但它变得非常冗长和笨拙。 setwd("") ..
发布时间:2022-06-29 18:11:37 其他开发

使用循环创建对象,该循环将r中的列表设置为子集

我有一个包含90个名称的列表,我希望使用循环将它们划分并包含到对象中。我已经根据模式选择了列表的名称,但是我不确定如何循环来创建对象名称。我以前尝试过使用assign()函数,但它创建的是值(在反号`内),而不是对象。谢谢! 这个列表有90个名字,每个样本名称重复5次,所以基本上我总共有18个样本,每个样本有5个文件。我想为每个样本创建一个对象,其中包含与该样本相对应的名称列表,因此该列表包含5 ..
发布时间:2022-03-14 13:37:21 其他开发

按列表列出数据框中的过滤列

我想从我现有的数据框中生成一个新的数据框,其中这个新DF中的列是根据该变量是否在单独的向量中列出(即,作为行)来选择的。因此,新的df将只包含矢量中列出的那些列。为了提高效率,我希望在不必手动指示这些列的情况下执行此操作。 我的直觉是这是一个相当简单的操作,但是作为R的新手,我不太确定如何处理这个问题。 推荐答案 我今天才用到这个(在SO上的另一个答案中)。 如果要创建串联 ..
发布时间:2022-03-14 13:30:22 其他开发

使用gglot绘制散点图,使用索引绘制x轴和y轴上同一变量的子集

我正在使用Heathrow下载的Met Office数据的天气数据子集。此数据集不包含缺失值。 使用gglot,我想为希思罗机场的最高温度(Tmax)创建散点图,将2018年的数据与2019年的数据进行对比(例如,请参见下面的示例)。2018和2019年都有12个数据点。 我已经用下面的方法尝试过,但是不起作用。这似乎是由于代码在不尝试使用aes()函数内的索引时运行良好,所以进行了索 ..
发布时间:2022-03-14 13:28:11 其他开发

选择每个组具有多个不同值的组

我有如下数据: ID category class 1 a m 1 a s 1 b s 2 a m 3 b s 4 c s 5 d s 我想通过仅包括那些具有几个(> 1)不同类别的“ID”来设置数据子集。 我的预期输出: ID categor ..
发布时间:2022-03-14 13:23:02 其他开发

r如何变异行的子集

我在变异dplyr中的行子集时遇到问题。我使用CHAINING命令:%>%表示: data % filter(ColA == "ABC") %>% mutate(ColB = "XXXX") 这可以很好地工作,但问题是我希望能够选择整个原始表,并看到变体只应用于我指定的数据子集。我的问题是,在此之后查看数据时,我只能看到data及其更新的ColB信息的子集。 ..
发布时间:2022-03-14 13:20:19 其他开发

查找向量组合的索引值

在下面的可复制数据中,我想知道如何从满足以下条件的一对一匹配向量rs&;hat中找到元素的索引值: rs 1.96元素对应的hat元素为hat>;max_hat元素 是否可以在下图中绘制(使用text())其绘制圆旁边的索引值? x ..
发布时间:2022-03-14 13:16:48 其他开发

过滤匹配模式的字符串列表的正则表达式

我使用R的次数要多得多,用R: 做起来更容易 > test test[grepl("^x",test)] [1] "xzz" "xaa" 但是如果test是一个列表,那么在python中该怎么做呢? 附注:我正在使用Google的python练习学习python,我更喜欢使用正则表达式。 推荐答 ..
发布时间:2022-03-14 13:10:24 Python