grid-search - IT屋-程序员软件开发技术分享社区

GridSearchCV.Best_Score不同于CROSS_VAL_Score(GridSearchCV.Best_Estiator_)

考虑以下网格搜索： grid = GridSearchCV(clf, parameters, n_jobs =-1, iid=True, cv =5) grid_fit = grid.fit(X_train1, y_train1) 根据SkLearning的资源，grid_fit.best_score_ 返回Best_Estiator的交叉验证的平均分数。对我来说，这意味着： ..

使用KNeighbors分类器的SKLearning管道

我正在尝试使用KNeighbors分类器和支持向量机在sklear中构建一个GridSearchCV管道。到目前为止，我已经尝试了以下代码： from sklearn.model_selection import GridSearchCV from sklearn.pipeline import Pipeline from sklearn.neighbors import KNeighbor ..

发布时间：2022-07-14 14:44:47 python scikit-learn pipeline grid-search Python

在GridSearchCV中使用管道

假设我有这个Pipeline对象： from sklearn.pipeline import Pipeline pipe = Pipeline([ ('my_transform', my_transform()), ('estimator', SVC()) ]) 要将超参数传递给我的支持向量分类器(SVC)，我可以执行如下操作： pipe_parameters = ..

发布时间：2022-04-07 23:05:25 scikit-learn svm pipeline grid-search 其他开发

Gridsearch CV中的评分

我刚刚开始使用Python中的GridSearchCV，但是我搞不清楚这里面到底有什么好处。我见过的某个地方 scorers = { 'precision_score': make_scorer(precision_score), 'recall_score': make_scorer(recall_score), 'accuracy_score': make_sco ..

发布时间：2022-03-02 10:05:02 python machine-learning data-science grid-search AI人工智能

如何保存 GridSearchCV 对象?

最近，我一直致力于在带有 Tensorflow 后端的 Keras 中应用网格搜索交叉验证 (sklearn GridSearchCV) 进行超参数调整.我的模型调整好后我正在尝试保存 GridSearchCV 对象以供以后使用，但没有成功. 超参数调优如下: x_train, x_val, y_train, y_val = train_test_split(NN_input, NN_ta ..

发布时间：2022-01-24 19:12:04 python scikit-learn keras save grid-search Python

使用带有管道和 GridSearch 的 cross_val_score 拟合嵌套交叉验证

我在 scikit 工作，我正在尝试调整我的 XGBoost.我尝试使用管道进行嵌套交叉验证来重新缩放训练折叠(以避免数据泄漏和过度拟合)，并与 GridSearchCV 并行进行参数调整和 cross_val_score 以最终获得 roc_auc 分数. from imblearn.pipeline import Pipeline从 sklearn.model_selection 导入 Re ..

发布时间：2022-01-07 13:41:36 scikit-learn nested pipeline cross-validation grid-search 其他开发

用于 Scikit Learn 的 Keras 包装器 - AUC 评分器不起作用

我正在尝试使用 Keras Scikit Learn Wrapper 来随机搜索参数更简单.我在这里写了一个示例代码: 我生成了一个人工数据集: 我正在使用 scikit learn 中的 moons from sklearn.datasets import make_moons数据集 = make_moons(1000) 模型构建器定义: 我定义了需要的build_fn函 ..

发布时间：2021-12-31 17:05:04 machine-learning scikit-learn neural-network keras grid-search AI人工智能

GridSearchCV(sklearn) 中的多个估计器

我正在查看有关 GridSearchCV 的 sklearn 文档网页.GridSearchCV 对象的属性之一是 best_estimator_.所以这是我的问题.如何将多个估计量传递给 GSCV 对象? 使用如下字典:{'SVC()':{'C':10, 'gamma':0.01}, 'DecTreeClass()':{....}}? 解决方案 GridSearchCV 适用于参数 ..

发布时间：2021-12-25 14:55:35 python scikit-learn grid-search Python

Sklearn 如何使用 Joblib 或 Pickle 保存从管道和 GridSearchCV 创建的模型?

在使用pipeline 和GridSearchCV 确定最佳参数后，我如何pickle/joblib 这个过程以后再用?当它是单个分类器时，我知道如何执行此操作... from sklearn.externals import joblibjoblib.dump(clf, 'filename.pkl') 但是如何在执行和完成 gridsearch 后使用最佳参数保存整个 pipeline ? ..

发布时间：2021-12-25 14:51:59 python scikit-learn pipeline grid-search Python

从 GridSearchCV 检索特定分类器和数据

我正在使用以下代码在服务器上运行 Python 3 分类脚本: #为转换后的数据定义knn分类器knn_classifier = neighbor.KNeighborsClassifier()# 定义 KNN 参数knn_parameters = [{'n_neighbors': [1,3,5,7, 9, 11],'leaf_size': [5, 10, 15, 20, 25, 30, 35, ..

发布时间：2021-12-25 14:49:31 python machine-learning scikit-learn cross-validation grid-search AI人工智能

使用嵌套在 GridSearchCV 中的 RFECV 时，如何避免使用 estimator_params?

我目前正在使用 scikit-learn 为基于树的方法在网格搜索 (GridSearchCV) 中进行递归特征消除 (RFECV).为此，我使用了 GitHub 上的当前开发版本 (0.17)，它允许 RFECV 使用树方法中的特征重要性来选择要丢弃的特征. 为清楚起见，这意味着: 循环当前树方法的超参数对每组参数执行递归特征消除以获得最佳特征数报告“分数"(例如准确性) ..

发布时间：2021-12-25 14:33:07 scikit-learn feature-selection grid-search 其他开发

具有多次重复的 scikit-learn GridSearchCV

我正在尝试为 SVR 模型获取最佳参数集.我想在 C 的不同值上使用 GridSearchCV.但是，从之前的测试中，我注意到训练/测试集的拆分会极大地影响整体性能(在本例中为 r2).为了解决这个问题，我想实现一个重复的 5 折交叉验证 (10 x 5CV).是否有使用 GridSearchCV 执行它的内置方式? 快速解决方案: 遵循 sci-kit 官方文档中提出的想法，一个快 ..

发布时间：2021-12-25 14:17:36 python scikit-learn cross-validation grid-search Python

如何从 GridSearchCV 绘制网格分数?

我正在寻找一种在 sklearn 中从 GridSearchCV 绘制 grid_scores_ 的方法.在这个例子中，我试图网格搜索 SVR 算法的最佳 gamma 和 C 参数.我的代码如下所示: C_range = 10.0 ** np.arange(-4, 4)gamma_range = 10.0 ** np.arange(-4, 4)param_grid = dict(gamma=g ..

发布时间：2021-12-14 10:07:52 python machine-learning scikit-learn grid-search AI人工智能

如何在python的sklearn中使用gridsearchcv执行特征选择

我使用递归特征消除和交叉验证(rfecv)作为随机森林分类器的特征选择器，如下所示. X = df[[my_features]] #我的所有功能y = df['gold_standard'] #labelsclf = RandomForestClassifier(random_state = 42, class_weight="平衡")rfecv = RFECV(estimator=clf, s ..

发布时间：2021-12-14 09:55:31 python machine-learning scikit-learn data-science grid-search AI人工智能

“平行"使用 gridsearch 获得最佳模型的管道

在 sklearn 中，可以定义串行管道以获得管道所有连续部分的最佳超参数组合.串行管道可以按如下方式实现: from sklearn.svm import SVC从 sklearn 导入分解，数据集从 sklearn.pipeline 导入管道从 sklearn.model_selection 导入 GridSearchCV数字 = datasets.load_digits()X_train ..

发布时间：2021-12-14 09:54:50 python machine-learning scikit-learn grid-search AI人工智能

使用 Keras 和 sklearn GridSearchCV 交叉验证提前停止

我希望使用 Keras 和 sklean 的 GridSearchCV 实现提前停止. 下面的工作代码示例修改自 How to Grid使用 Keras 在 Python 中搜索深度学习模型的超参数.数据集可能是从这里下载. 修改增加了 Keras EarlyStopping 回调类，防止过拟合.为了使其有效，它需要 monitor='val_acc' 参数来监控验证准确性.要使 v ..

发布时间：2021-12-14 09:51:37 machine-learning scikit-learn keras cross-validation grid-search AI人工智能

将 sklearn 的 GridSearchCV 与管道一起使用，只需预处理一次

我正在使用 scickit-learn 来调整模型超参数.我正在使用管道将预处理与估计器链接起来.我的问题的简单版本如下所示: 将 numpy 导入为 np从 sklearn.model_selection 导入 GridSearchCV从 sklearn.pipeline 导入 make_pipeline从 sklearn.preprocessing 导入 StandardScaler从 sk ..

发布时间：2021-12-14 09:50:24 python numpy machine-learning scikit-learn grid-search AI人工智能

在 Scikit-learn 中使用 Smote 和 Gridsearchcv

我正在处理一个不平衡的数据集，并希望使用 scikit 的 gridsearchcv 进行网格搜索以调整我的模型参数.为了对数据进行过采样，我想使用 SMOTE，而且我知道我可以将其作为管道的一个阶段包含在内并将其传递给 gridsearchcv.我担心的是，我认为 smote 将同时应用于训练和验证折叠，这不是您应该做的.验证集不应过采样.整个管道将应用于两个数据集拆分是否正确?如果是，我该如何 ..

发布时间：2021-12-14 09:39:18 python machine-learning scikit-learn grid-search oversampling AI人工智能

使用 GridSearch 时使用 Scikit-learn 的模型帮助

作为安然项目的一部分，构建了附加模型，以下是步骤的总结，以下模型给出了非常完美的分数 cv = StratifiedShuffleSplit(n_splits = 100, test_size = 0.2, random_state = 42)gcv = GridSearchCV(pipe, clf_params,cv=cv)gcv.fit(特征，标签)--->使用完整数据集对于 cv. ..

发布时间：2021-12-14 09:33:45 python machine-learning scikit-learn cross-validation grid-search AI人工智能

GridSearchCV 是否执行交叉验证?

我目前正在研究一个问题，该问题在同一数据集上比较三种不同的机器学习算法的性能.我将数据集分成 70/30 个训练/测试集，然后使用 GridSearchCV 和 X_train, y_train 对每个算法的最佳参数进行网格搜索. 第一个问题，我是想在训练集上执行网格搜索还是想在整个数据集上执行网格搜索? 第二个问题，我知道 GridSearchCV 在其实现中使用 K-fold，如果 ..

发布时间：2021-12-14 09:33:20 python machine-learning scikit-learn cross-validation grid-search AI人工智能

grid-search相关内容