factors相关内容

如何确保分区具有来自因子每个级别的代表性观察?

我编写了一个小函数来将我的数据集划分为训练集和测试集.但是,我在处理因子变量时遇到了麻烦.在我的代码的模型验证阶段,如果模型建立在没有来自每个因子级别的表示的数据集上,我会收到错误消息.如何修复此 partition() 函数以包含来自因子变量每个级别的至少一个观察结果? test.df EDIT - 使用“caret"包和 createDataPartition() 的新函数: part ..
发布时间:2022-01-07 23:13:39 其他开发

从 ggplot 条形图中删除未使用的因子水平

我想做与这个问题相反的事情,并且有点相反这个问题,虽然那是关于传说,而不是情节本身. 其他 SO 问题似乎在询问如何保持未使用的因子水平.我实际上希望我的被移除.我有几个名称变量和几列(宽格式)变量属性,我用它们来创建许多条形图.这是一个可重现的示例: 库(ggplot2)df ..
发布时间:2021-12-21 09:33:47 其他开发

nᵗʰ丑数

质因数只有 2、3 或 5 的数称为丑数. 示例: 1, 2, 3, 4, 5, 6, 8, 9, 10, 12, 15, ... 1 可以认为是 2^0. 我正在寻找第 nth 个丑陋的数字.请注意,随着 n 变大,这些数字的分布极其稀疏. 我写了一个简单的程序来计算给定的数字是否丑陋.对于 n >500 - 它变得超级慢.我尝试使用备忘录 - 观察:ugly_number ..
发布时间:2021-12-06 20:16:22 其他开发

直接按升序枚举一个数的因数而不排序?

是否有一种高效的算法可以按升序枚举一个数 n 的因数而不进行排序?我所说的“高效"是指: 该算法从 n 的素数功率因数分解开始,避免了对除数的蛮力搜索. 算法的运行时复杂度为 O(d log₂ d) 或更好,其中 d 是n. 算法的空间复杂度为 O(d). 该算法避免了排序操作.也就是说,因子是按顺序生成的,而不是乱序生成然后排序.尽管使用简单的递归方法枚举然后排序是 O( ..
发布时间:2021-12-06 20:04:06 其他开发

R:为什么我没有得到类型或类的“因素"?将列转换为因子后?

我有以下设置. df 然后我尝试将其中一列转换为“因子".但是正如你在下面看到的,我没有得到任何“因子"类型或类.我做错了什么吗? df[, 1] 解决方案 抱歉,我觉得我原来的答案写得不好.为什么我一开始就把那个“因素矩阵"放进去?这是一个更好的尝试. 来自 ?apply: 如果‘X’不是数组而是具有非空值的类的对象‘dim’值(例如数据框),‘apply’试图强制它如果 ..
发布时间:2021-11-16 23:12:50 其他开发

列是字符而不是因子有什么好的理由吗?

这个想法似乎是一个愚蠢的问题,但在使用 R 几个月后我意识到我经常发现自己将字符串转换为因子,例如,tabulate 函数不起作用字符串. 此时我正在考虑简单地将任何字符串转换为因子.但这引出了一个问题,是否有任何理由不这样做(除了对字符串本身进行操作之外)? 解决方案 因素有双重表示——“标签";以及级别的底层编码.R 使用这些表示中的哪一种可能是微妙和令人困惑的. 这可能令 ..
发布时间:2021-09-11 19:43:17 其他开发

R:绘图时 x 轴上的字符而不是级别 #?

我需要帮助在 x 轴上绘制月份名称,而不是指定月份的级别.我正在处理一个“水年",所以 10 月被指定为 1 级,9 月结束时为 12 级.我相信这很容易,只是我不经常使用因子.谢谢! 研究完成:根据 R 中的数字向量绘制字符向量 R 绘图,x 轴上的日期 这是我的数据的简化示例 Months 这会将具有正确月份的数据放在正确的位置,只是错误的标签. 解决方案 我们 ..
发布时间:2021-06-18 19:20:42 其他开发

获取一个数的因数

我需要得到给定数 (n) 的两个因数 (x, y),使得: x * y x * y 应该尽可能接近 n x 和 y 应尽可能彼此靠近. 示例: n = 16 => x = 4,y = 4 n = 17 => x = 4,y = 4 n = 18 => x = 6,y = 3 n = 20 => x = 5,y = 4 任何语言都可以,但最好是 php. 编辑— ..
发布时间:2021-06-10 19:16:05 PHP

按因子按级别均值

也许这很简单,但我在网上找不到答案.我在按级别按因子计算均值时遇到问题.我的数据看起来很典型: 因子,值一,1a2b,1b,1b,1c,1 我想让向量 A 只包含“a"级的平均值如果我在控制台上输入 A 我想得到 1.5而这种计算均值的方法,必须使用因子. 预先感谢您的帮助. 解决方案 发布 data.table 解决方案只是为了好玩,尽管您可能应该按照 @lukeA 的建议进行 ..
发布时间:2021-06-02 19:19:06 其他开发

如何在C ++中找到数字的素因数?

我正在尝试项目euler问题3,但没有得到期望的结果.我的逻辑: 列出数字13195的所有因子并将它们保存在数组中. 检查数组中的每个数字是否都是质数. 如果发现该数字是素数,则将其保存在另一个数组中. 显示第二个数组的内容. 希望它只包含主要因素. 结果:第一个数组包含了所有预期的因素,第二个数组我认为与第一个数组重复或存在一些非素数,请帮忙!:) 我的代码: #i ..
发布时间:2021-04-19 20:16:40 C/C++开发

具有多个因素分组的Barplots,以及这些因素之间的变量均值

我正在尝试创建一个条形图,以显示按单身或按大学毕业生或非大学毕业生分组的工会和非工会工人的平均小时工资.虽然我设法用两个因素分组构造了一个可通过的条形图,但我不知道如何使用三个因素分组来构造.我看到的具有三个因素的示例仅着眼于频率计数,因此我不确定如何将所有因素中另一个变量的均值合并到图中.我要创建的东西看起来像这样(在Stata中创建):按工会状况,婚姻状况和大学毕业的平均小时工资我的代码如下: ..
发布时间:2021-04-14 19:16:18 其他开发

按降序对条形进行分组?

我想将我的图表分为两组,并在每一组中按降序排列.我有一个包含变量的文件: structure(list(Description = c("car","ball","cup","pen","pencil",“计算机",“椅子",“桌子",“枕头",“床",“床垫",“剪刀",“书",“勺子",“地毯",“扬声器",“框架",“窗帘",“阴影",“信封",“手机",“字母",“香",“背包",“盒 ..
发布时间:2021-04-14 19:14:10 其他开发

丑陋的数字

仅主因子为2、3或5的数字称为丑陋的数字. 示例: 1,2,3,4,5,6,8,9,10,12,15,... 1可以视为2 ^ 0. 我正在寻找第n 个丑陋的数字.请注意,随着 n 变大,这些数字的分布极为稀疏. 我写了一个琐碎的程序,计算给定数字是否丑陋.对于 n>500 -变得超级慢.我尝试使用记忆-观察: ugly_number * 2 , ugly_number ..
发布时间:2021-04-02 20:22:55 其他开发

获取因子变量中级别和标签之间的原始关联

我正在寻找一个函数来获取因子变量的原始映射表.我导入一个Rdata文件.我有一个名为"FactVar"的因子变量.我知道"FactVar"的映射表如下: "010025" -> city1 "015146" -> city2 "048017" -> city3 "082053" -> city4 在我的数据框中,"FactVar"数据如下(前5种情况): 1: city1 2: c ..
发布时间:2021-02-15 20:45:08 其他开发