scikit-learn相关内容

K均值簇中节点和质心之间的距离?

用于提取k均值群集中节点和质心之间距离的任何选项。 我对一个嵌入文本的数据集进行了KMeans聚类,我想知道每个集群中哪些节点远离质心,以便我可以检查各个节点的功能是否有所不同。 提前谢谢! 推荐答案 KMeans.transform()返回每个样本到群集中心的距离数组。 import numpy as np from sklearn.datasets import ..
发布时间:2022-04-25 20:42:12 其他开发

如何在与RFECV结合时使用GridSearch中的';max_Feature';?

感谢您提前答复。这是我的第一篇帖子,而且我还是个新手,所以如果我的内容格式化得很糟糕,我很抱歉。 我正在尝试将递归特征消除和网格搜索结合起来,以确定超参数和特征数量的最佳组合。使用下面的代码时,我得到max_Feature必须在(0,n_Feature]估计器拟合失败。除max_Feature之外的任何值都是1。我的数据集中有300多个要素,其中许多可能并不重要。 ‘’ ..
发布时间:2022-04-24 21:28:14 其他开发

在随机林中使用Forecast()和Predict_Proba()进行计算时,ROC_AUC_Score不同

在随机林中预测()和预测_Proba()产生不同的ROC_AUC_Score。 我知道Forecast_Proba()给出了概率,比如在二进制分类的情况下,它会给出两个对应于两个类别的概率。 Forecate()给出它预测的类。 #Using predict_proba() rf = RandomForestClassifier(n_estimators=200, ra ..

如何在本网站的RandomForestRegressor中订购&Quot;Feature_Importance_&Quot

如果我运行一个模型(在本例中名为clf),我会得到如下所示的输出。如何将其与用于训练分类器的功能输入绑定? >>> clf.feature_importances_ array([ 0.01621506, 0.18275428, 0.09963659,... ]) 推荐答案 正如评论中提到的,顺序或功能重要性看起来是“x”输入变量的顺序(我已将其从Pandas转换为Pytho ..
发布时间:2022-04-22 19:19:23 Python

有没有办法适当地调整这个逻辑回归函数,以说明多个自变量和固定效应?

我想对下面包含的LogitRegress函数进行修改,以包括其他自变量和固定效果。 以下代码改编自此处提供的答案:how to use sklearn when target variable is a proportion from sklearn.linear_model import LinearRegression from random import choices from ..

在一个模型中,精确度和召回率是相同的

我正在进行一个多分类项目,我注意到无论我运行什么分类器,模型中的精度和召回率都是相同的。 分类问题有三个截然不同的类别。数据量偏小,13k实例分为测试(0.8)和训练(0.2)。 训练数据的形状为(10608,28),标签的形状为(10608,3)(二进制标签)。 分类不平衡: 标签0占所有标签的30% 标签1占所有标签的4% 标签2占所有标签的66%。 我正在比 ..

SCRKIT学习管道是否将StandardScaler应用于y?

鉴于我的渠道 pipe = Pipeline([('scaler', StandardScaler()), ('regressor', LinearRegression())]) 然后我调用pipe.fit(X_train, y_train),管道是将缩放器同时应用于功能和目标,还是仅应用于功能? 如果不是,y参数在StandardScaler的fit_transform方法中有什么作 ..
发布时间:2022-04-09 18:51:21 Python

使用SimpleImputer和OneHotEncode的管道-如何正确使用?

我面临的挑战是创建一个管道来计算(SI)一个类别变量(如颜色),然后输入(OHE)2个变量(如颜色和星期几)。在两个步骤中使用了颜色。 我想将SI和OHE放在1 ColumnTransformer中。我刚刚了解到SI和OHE是并行运行的,这意味着OHE不会对推算的颜色进行编码。 然后我尝试: si = SimpleImputer(strategy='mean', add_indi ..
发布时间:2022-04-09 18:48:35 Python

Sklearn带管道的自定义转换器:级联轴的所有输入数组维度必须完全匹配

我正在学习sklearn自定义转换器,并阅读有关创建自定义转换器的两种核心方法: 通过设置从BaseEstimator和TransformerMixin继承的自定义类,或 通过创建转换方法并将其传递给FunctionTransformer。 我想通过实现元矢量器和功能来比较这两种方法:支持CountVectorizer或TfidfVectorizer的矢量器,并根据指定的矢量器类型转 ..