r-caret相关内容
我的问题与中提出的问题非常相似 caret: combine createResample and groupKFold 唯一的区别是:我需要在分组后创建分层折叠(也重复10次),而不是引导重采样(据我所知它不是分层的),以便与插入的Train Control一起使用。 下面的代码使用10倍重复的简历,但我不能包括基于“ID”(df$ID)的数据分组。 # creating indices
..
我正在尝试使用高斯过程回归(GPR)模型来预测河流中的每小时径流流量。我已经得到了很好的结果,我应用了脱::内核实验室的列车()函数(感谢Kuhn!)。 由于不确定性概念是GPR的主要固有优势之一,我想知道是否有人可以帮助我访问与测试数据集的预测积分相关的结果。 我将摘录我一直使用的代码。由于我的真实数据非常庞大(老实说,我不知道怎么说才好),我将以数据(空气质量)为例。此特定示例中的
..
以下是我使用的代码: # data set for debugging in RStudio data("imports85") input
..
使用插入符号::Train()运行逻辑回归模型时遇到问题。 LR = caret::train(Satisfaction ~., data= log_train, method = "glm", preProcess = c("scale"), family="binomial") 继续出现以下错误行: 摘要出错。Connection(Connection):无效连接 这个错误对
..
我正在尝试将 iris 数据集拆分为训练集和测试集.我像这样使用 createDataPartition(): 库(插入符号)createDataPartition(iris$Species, p=0.1)# [1] 12 22 26 41 42 57 63 79 89 93 114 117 134 137 142createDataPartition(iris$Sepal.Length, p=
..
我正在处理多变量金融时间序列数据,但在使用 createTimeSlices 函数时遇到了问题.除了 Max Kuhn 使用的功能外,我找不到该功能的任何用途.谁能帮我理解这个函数的用法? 解决方案 文档正在对此功能进行“改进"(换句话说,它目前很烂).另一个人最近就此事与我联系,这里是示例: 库(插入符号)图书馆(ggplot2)数据(经济学)myTimeControl
..
我有一个看起来像这样的训练集 Name Day Area X Y Month Night攻击星期一 LA -122.41 37.78 8 0车辆 星期六 芝加哥 -1.67 3.15 2 0MOUSE 星期一台北 -12.5 3.1 9 1 Name 是结果/因变量.我将 Name、Area 和 Day 转换为因子,但我不确定是否应该为 Month> 和 Night,它们分别只取整数值 1-1
..
所以我读过一篇论文,该论文使用神经网络对一个数据集进行建模,该数据集与我目前使用的数据集相似.我有 160 个描述符变量,我想为 160 个案例建模(回归建模).我阅读的论文使用了以下参数:- '对于每个分割,都为 10 个单独的训练测试折叠中的每一个开发了一个模型.具有 33 个输入神经元和 16 个隐藏神经元的三层反向传播网络用于在线权重更新、0.25 学习率和 0.9 动量.对于每个折
..
来自 caret R 包的 parRF 不适用于具有多个核心的我,这非常具有讽刺意味,因为 parRF 中的 par 代表并行.如果这是相关信息,我在 Windows 机器上.我检查了我是否使用了最新的关于 caret 和 doParallel 的最佳版本. 我做了一个最小的例子,并在下面给出了结果.有什么想法吗? 源代码 库(插入符号)库(doParallel)trCtrl
..
我用 R 插入符训练了一个树模型.我现在正在尝试生成一个混淆矩阵并不断收到以下错误: confusionMatrix.default(predictionsTree, testdata$catgeory) 中的错误: 数据和参考因子必须具有相同的水平数 prob 生成混淆矩阵时出现错误.两个对象的级别相同.我无法弄清楚问题是什么.它们的结构和层次如下.他们应该是一样的.任何帮助将不胜感
..
我正在使用 glmnet 在插入符号中运行弹性网络正则化. 我将值序列传递给 trainControl 用于 alpha 和 lambda,然后我执行 repeatedcv 以获得 alpha 和 lambda 的最佳调整. 这是一个示例,其中 alpha 和 lambda 的最佳调整分别为 0.7 和 0.5: age 最佳 lambda 是: model.test$fina
..
我正在尝试使用 polr 包从 caret 的 train() 函数构建序数逻辑回归模型.polr 模型有一个名为“method"的参数,该参数与 train() 的参数“method"冲突.我想将 polr 模型参数设置为“logistic". 我该怎么做? 谢谢! 解决方案 使用polr时需要在train的tunegrid选项中指定方法. 在公式符号中,它应该是这样的
..
我在安装 R 包时遇到了一些问题.我在 ubuntu 中使用 R studio.问题来了 错误:依赖“plyr"不可用于包“scales"* 删除‘/home/nilmadhab/R/x86_64-pc-linux-gnu-library/3.0/scales’install.packages 中的警告:安装包“scales"的退出状态非零错误:依赖项“plyr"不可用于包“reshape2"*
..
我正在使用 text2vec 包和 caret 处理文本分类问题.在使用 caret 构建不同模型之前,我正在使用 text2vec 构建文档术语矩阵.目标是使用标记的训练数据识别两个字符串之间的字符串相似性. 但是,在训练线性 SVM 模型时,我收到了许多警告消息,摘录如下: 警告信息:1:在 svm.default(x = as.matrix(x), y = y, kernel =
..
我理解为什么并行处理只能用于 XGB 训练而不能用于其他模型.然而,令人惊讶的是,我注意到使用 xgb 进行预测也使用并行处理. 当我将超过 10M 的大型数据帧拆分为多个片段以预测使用 foreach %dopar% 时,我偶然注意到了这一点.这导致了一些错误,所以为了解决它们,我切换到 %do% 的顺序循环,但在终端中注意到所有处理器都在使用. 经过反复试验后,我发现 caret:
..
我想运行 logreg 回归.在 R 上运行代码后出现以下错误: 出了点问题;缺少所有准确度指标值: 准确度 Kappa最小.: NA 分钟.: 不适用第 1 区:不适用 第 1 区:不适用中位数:NA 中位数:NA均值:NaN 均值:NaN第三区:不适用 第三区:不适用最大限度.: 不适用: 不适用不适用:9 不适用:9train.default(x, y, weights = w,
..
在 R 中安装 caret 包通常需要多长时间?我运行了 install.packages('caret', dependencies = TRUE),R 已经运行了将近一个小时的安装.这正常吗? 解决方案 有依赖项,可能需要一段时间,我的花了大约 30 分钟,我的下载速度最大约为 18Mbps,截至 11 月 19 日它有 648 个依赖项.正如 the_SJC 的回答所暗示的那样,
..
我正在尝试在 R 上安装 caret 包,但我收到一条错误消息,指出包“caret"不可用(对于 R 版本 3.4.2).有没有办法解决这个问题? 解决方案 R CMD build (via r-devel) 添加了 3.5.0 的更高要求,并带有以下消息: 添加对 R >= 3.5.0 的依赖,因为序列化/加载版本 3 中的序列化对象无法在旧版本的 R 中读取.包含此类对象的文件:
..
我想计算 R 中 glmnet 模型的变量重要性.我使用 glmnet 包来拟合弹性网络模型,如 库(glmnet)图书馆(插入符号)图书馆(贵宾)data_y
..
在使用带有 caret::train 的 recipes::step_dummy 时出现以下错误(第一次尝试组合两个包): 错误:并非配方中的所有变量都存在于提供的训练集 不确定是什么导致了错误,也不确定调试的最佳方法.帮助训练模型将不胜感激. 库(插入符号)图书馆(tidyverse)图书馆(食谱)图书馆(rsample)数据(“信用数据")## 将数据分成训练集(75%)和测试集
..