gridsearchcv相关内容
感谢您提前答复。这是我的第一篇帖子,而且我还是个新手,所以如果我的内容格式化得很糟糕,我很抱歉。 我正在尝试将递归特征消除和网格搜索结合起来,以确定超参数和特征数量的最佳组合。使用下面的代码时,我得到max_Feature必须在(0,n_Feature]估计器拟合失败。除max_Feature之外的任何值都是1。我的数据集中有300多个要素,其中许多可能并不重要。 ‘’
..
我有一个使用决策树作为估计器的流水线GridearchCV 现在我想绘制与GridearchCV的Best_Estiator相对应的决策树 有一些关于堆栈溢出的回复,但没有人考虑在GridearchCV内建立管道 from sklearn.preprocessing import StandardScaler from sklearn.tree import DecisionTr
..
我想在SCRKIT学习中实现自定义丢失功能。我使用以下代码片段: def my_custom_loss_func(y_true,y_pred): diff3=max((abs(y_true-y_pred))*y_true) return diff3 score=make_scorer(my_custom_loss_func,greater_ is_better=False) c
..
当引用包含在 ColumnTransformer(它是管道的一部分)中用于 grid_search 的 param_grid 中的单个预处理器时,我想找出正确的命名约定. 环境&示例数据: 导入 seaborn 为 sns从 sklearn.model_selection 导入 train_test_split,GridSearchCV从 sklearn.impute 导入 SimpleI
..
我正在尝试从 sklearn.svm.LinearSVC 创建一个子类,用作 sklearn.model_selection.GridSearchCV 的估算器.子类有一个额外的函数,在这个例子中它什么都不做.但是,当我运行它时,我最终遇到了一个我似乎无法调试的错误.如果您复制粘贴代码并运行,它应该重现以 ValueError: Input contains NaN, infinity or a
..
我的问题似乎类似于这个,但有那里没有可靠的答案. 我正在进行多类多标签分类,为此我定义了自己的评分器.但是,为了在最后获得 refit 参数并获得模型的最佳参数,我们需要为 refit 引入评分器函数之一.如果我这样做,我会得到 missing 1 required positional argument: 'y_pred' 的错误.y_pred 应该是拟合的结果.但不确定这个问题是从哪里来
..
我正在使用 sklearn 进行主题建模.在尝试从网格搜索输出中获取对数似然时,我收到以下错误: AttributeError: 'str' 对象没有属性 'parameters' 我想我明白这个问题是:在旧版本中使用了“参数",而我正在使用 sklearn 的新版本 (0.22) 并且出现错误.我还搜索了新版本中使用的术语,但找不到.代码如下: # 从网格搜索输出中获取对数可能性n
..
我正在为一个机器学习项目而苦苦挣扎,我正在尝试将其结合起来: 一个 sklearn 列变换,用于将不同的变换器应用于我的数值和分类特征 应用我的不同转换器和估算器的管道 一个用于搜索最佳参数的 GridSearchCV. 只要我在我的管道中手动填写不同转换器的参数,代码就可以完美运行.但是,一旦我尝试传递不同值的列表以在我的 gridsearch 参数中进行比较,我就会收到各种无效
..
我想使用带有 LinearSVC 的 AdaBoostClassifier 作为基础估计器.我想对 LinearSVC 中的一些参数进行网格搜索.此外,我还必须扩展我的功能. p_grid = {'base_estimator__C': np.logspace(-5, 3, 10)}n_splits = 5inner_cv = StratifiedKFold(n_splits=n_splits,
..
我正在尝试将参数传递给 scikit learn 中的自定义估算器,但未能成功.我希望参数 lr 在 gridsearch 期间更改.问题是 lr 参数没有改变... 从此处复制和更新代码示例> (原始代码对我不起作用) 任何带有自定义估算器的 GridSearchCV 完整工作示例,以及更改参数将不胜感激. 我在 ubuntu 18.10 使用 scikit-learn 0.
..
我想对 sklearn.svm.LinearSVC 进行子类化,并将其用作 sklearn.model_selection.GridSearchCV 的估计器.我之前在子类化方面遇到了一些问题,我想我根据我之前的帖子和选定的答案修复了它. 然而,现在我的目标是创建一个 sklearn.kernel_approximation.RBFSampler 对象作为我的新类的属性.现在这是一个例子,我
..
GridSearchCV 和 RandomizedSearchCV 具有 best_estimator _ : / p> 仅返回最佳估算器/模型 通过一种简单的评分方法找到最佳估算器:准确性,召回率,精度等。 仅基于训练集进行评估 我想通过 我自己的评分方法定义 进一步评估测试集,而不是像GridSearchCV那样进行训练。最终,至关重要的是测试仪的性能。训练集倾向于在G
..
我在下面的代码中尝试使用自定义评分器,该评分器是通过GridSearchCV定义"custom_loss_five"来调整超参数的.我有下面的示例代码.我也有一些样本数据.我收到一个错误的"numpy.dtype"对象,没有属性"base_dtype".我认为这是因为我将keras代码与sklearn混合在一起.我还使用相同的"custom_loss_five"函数来训练神经网络.这就是为什么我使
..
我要做什么? 我正在尝试在GridSearchCV()中使用StratifiedKFold(). 然后,什么让我感到困惑? 当我们使用K折叠交叉验证时,我们只需传递GridSearchCV()内的CV编号,如下所示. grid_search_m = GridSearchCV(rdm_forest_clf, param_grid, cv=5, scoring='f1', re
..
早上好!我是python的新手,我使用Spyder 4.0构建神经网络. 在下面的脚本中,我使用随机森林来实现功能的重要性.因此,值importances是告诉我每个功能的重要性的值.不幸的是,我无法上传数据集,但是我可以告诉您,有18个要素和1个标签,都是物理量,这是一个回归问题. 我想在excel文件中导出变量importances,但是当我执行该操作(简单地将向量关联)时,数字就是点(例如0
..
def show3D(searcher, grid_param_1, grid_param_2, name_param_1, name_param_2, rot=0): scores_mean = searcher.cv_results_['mean_test_score'] scores_mean = np.array(scores_mean).reshape(len(grid_
..
我正在将recurive feature elimination with cross validation (rfecv)作为GridSearchCV的特征选择技术. 我的代码如下. X = df[my_features_all] y = df['gold_standard'] x_train, x_test, y_train, y_test = train_test_split(
..