scikit-learn相关内容

硬边距支持向量机的Sklearn内置函数

我知道软边距支持向量机有一个内置函数,如下所示。 from sklearn.svm import SVC clf = SVC(C=1, kernel = 'linear') clf.fit(X, y) 但对于硬间隔支持向量机,我们需要C=0,对吗?但当我让C=0时,代码报告错误ValueError: C ..
发布时间:2022-04-07 23:14:17 Python

将LinearSVC的决策函数转换为概率(Scikit学习Python)

我使用来自SCRKIT学习的线性支持向量机(LinearSVC)来解决二值分类问题。我知道LinearSVC可以给我预测的标签和决策得分,但我想要概率估计(对标签的信心)。由于速度的原因,我想继续使用LinearSVC(与使用线性内核的sklearn.svm.SVC相比)使用Logistic函数将决策分数转换为概率是否合理? import sklearn.svm as suppmach # ..
发布时间:2022-04-07 23:07:12 AI人工智能

如何修复ValueError:不支持多类格式

这是我的代码,我试图计算ROC分数,但我遇到了ValueError的问题:不支持多类格式。我已经在找科学工具包学习了,但它没有帮助。最后,我仍然有ValueError:不支持多类格式。 这是我的代码 from sklearn.tree import DecisionTreeClassifier from sklearn.ensemble import BaggingClassifier ..
发布时间:2022-04-05 19:56:12 Python

使用SkLearning使用Kera数据生成器绘制混淆矩阵

SkLearning清楚地定义了如何使用其自己的分类模型绘制混淆矩阵1。 但将其与使用数据生成器的Kera模型一起使用又如何呢?让我们看一看示例代码: 首先,我们需要训练模型。 import numpy as np from keras import backend as K from keras.models import Sequential from keras.layers.core ..
发布时间:2022-04-01 21:35:27 Python

SkLearning:关闭警告

当我使用单列pythonpandasDataFrame(不是Series对象)调整sklearn的LogisticRegression时,收到以下警告: /Library/Python/2.7/site-packages/sklearn/preprocessing/label.py:125: DataConversionWarning: A column-vector y ..
发布时间:2022-03-27 18:16:35 Python

TensorFlow多元线性回归结果在NAN中的应用

我正在使用sklearn的波士顿住房数据集(506x13矩阵)进行多元线性回归。我计划使用所有数据对其进行训练,然后“插入”一个随机数据(如boston_dataset.data[39]),然后查看损失情况。但当我打印结果时,得到的只有NaN。这是我的代码。 import tensorflow as tf import numpy as np import matplotlib.pyplot ..

使用SkLearning线性回归,我如何才能将计算出的回归系数限制为大于0?

我在这里使用skLearning的引用http://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LinearRegression.html,但是没有约束回归系数的选项。 有没有人知道python中还有另一个包可以执行多变量线性回归,并将回归系数约束为大于0? 这是我到目前为止拥有的代码。 '''da ..
发布时间:2022-03-24 22:02:59 Python

Python SCRICKIT-了解丢失数据的群集

我希望对缺少列的数据进行群集。手动操作时,我会在缺少列的情况下简单地计算距离,而不需要此列。 使用SCRICKIT-LEARN,不可能丢失数据。也没有机会指定用户距离函数。 是否有机会群集丢失的数据? 示例数据: n_samples = 1500 noise = 0.05 X, _ = make_swiss_roll(n_samples, noise) rnd = n ..
发布时间:2022-03-22 11:02:24 Python

LDA生成的组件比Python中要求的少

我正在处理以下数据集: http://archive.ics.uci.edu/ml/datasets/Bank+Marketing 可以通过单击数据文件夹链接找到数据。存在两个数据集,一个训练集和一个测试集。我使用的文件包含两个集合中的组合数据。 我正在尝试应用线性判别分析(LDA)来获得两个组件,但是,当我的代码运行时,它只产生一个组件。如果设置“n_Components=3” ..

在k-均值聚类中,如何设置每个簇的最小观测数?

我正在尝试根据用户行为对一些产品进行集群。我最后看到的是具有非常不同观测数量的星团。 我已检查k-Means群集参数,但找不到控制每个群集的最小(或最大)观察数的参数。 例如,此处显示了观察值数量在不同群集之间的分布方式。 cluster_id num_observations 0 6 1 4 2 1 3 3 4 29 5 5 有关于如何处理此问题 ..

我可以在skLearning上进行对数回归吗?

我不知道“对数回归”是否是正确的术语,我需要在我的数据上拟合一条曲线,就像一条多项式曲线,但末尾是平坦的。 这是一张图片,蓝色的曲线就是我所拥有的(二阶多项式回归),洋红色的曲线就是我需要的。 我搜索了很多,但没有找到,只有线性回归,多项式回归,但没有在skLearning上的对数回归。我需要绘制曲线,然后使用该回归进行预测。 编辑 以下是我发布的绘图图像的数据: x ..
发布时间:2022-02-26 19:12:39 Python

支持向量机模型将概率得分大于0.1(默认阈值0.5)的实例预测为正值

我正在处理一个二进制分类问题。在这种情况下,我使用了从skLearning导入的Logistic回归和支持向量机模型。这两个模型用相同的、不平衡的训练数据进行拟合,并调整了类权重。他们也取得了可比的成绩。当我使用这两个预先训练好的模型来预测新的数据集时。LR模型和SVM模型预测的实例数与正数相似。并且预测的实例共享很大的重叠。 然而,当我查看被归类为阳性的概率得分时,LR的分布是从0.5到1,而 ..
发布时间:2022-02-21 16:31:00 AI人工智能