auc相关内容

F1 分数 vs ROC AUC

我有以下两种不同情况的 F1 和 AUC 分数 模型 1:精度:85.11 召回:99.04 F1:91.55 AUC:69.94 模型 2:精度:85.1 召回:98.73 F1:91.41 AUC:71.69 我的问题的主要动机是正确预测正例,即减少假负例 (FN).我应该使用 F1 分数并选择模型 1 还是使用 AUC 并选择模型 2.谢谢 解决方案 简介 根 ..
发布时间:2021-12-14 10:06:38 AI人工智能

Scikit-learn : roc_auc_score

我正在使用 scikit-learn 的 roc_auc_score 函数来评估我的模型性能.但是,无论我使用 predict() 还是 predict_proba() ,我都会得到不同的值 p_pred = forest.predict_proba(x_test)y_test_predicted=forest.predict(x_test)fpr, tpr, _ = roc_curve(y_t ..
发布时间:2021-12-14 10:00:24 AI人工智能

Tensorflow 1.4 tf.metrics.auc 用于 AUC 计算

我正在尝试在我的模型的训练时间期间记录AUC. 根据文档,tf.metric.auc 需要 label 和 predictions,两者的形状相同. 但在我的二元分类情况下,label 是一个 一维 张量,只包含类.而prediction 是二维,包含每个数据点的每个类别的概率. 在这种情况下如何计算AUC? 解决方案 我们来看看函数中的参数tf.metrics.auc: ..
发布时间:2021-09-05 18:59:47 Python

StatsModels 的预测函数如何与 scikit-learn 的 roc_auc_score 交互?

我正在尝试了解 Logit 模型的 Python statsmodels 中的 predict 函数.它的文档位于此处. 当我构建 Logit 模型并使用 predict 时,它返回从 0 到 1 的值,而不是 0 或 1.现在我读到这篇文章说这些是概率,我们需要一个阈值.Python statsmodel.api 逻辑回归 (Logit) 现在,我想生成 AUC 数字,我使用 skl ..

解释不平衡数据集上的 AUC、准确率和 f1 分数

我试图了解在数据集不平衡的情况下,AUC 如何成为比分类准确度更好的指标. 假设一个数据集包含 3 个类的 1000 个示例,如下所示: a = [[1.0, 0, 0]]*950 + [[0, 1.0, 0]]*30 + [[0, 0, 1.0]]*20 显然,这个数据是不平衡的. 一种幼稚的策略是预测属于第一类的每个点. 假设我们有一个具有以下预测的分类器: b = [[0.7, ..

roc_auc_score - y_true 中只有一个类

我正在对现有数据框进行 k 折 XV,我需要获得 AUC 分数.问题是——有时测试数据只包含 0,而不包含 1! 我尝试使用 this 示例,但使用不同的数字: 将 numpy 导入为 np从 sklearn.metrics 导入 roc_auc_scorey_true = np.array([0, 0, 0, 0])y_scores = np.array([1, 0, 0, 0])roc ..
发布时间:2021-07-16 19:52:26 Python

从 R 中的交叉验证(训练)数据绘制 ROC 曲线

我想知道是否有办法根据 caret 包生成的 SVM-RFE 模型的交叉验证数据绘制平均 ROC 曲线. 我的结果是: 递归特征选择外重采样方法:Cross-Validated(10折,重复5次)子集大小的重采样性能:变量 ROC Sens Spec Accuracy Kappa ROCSD SensSD SpecSD AccuracySD KappaSD Selected1 0.6911 ..
发布时间:2021-07-03 18:34:33 其他开发

使用插入符号、glmnet 和(嵌套)交叉验证构建嵌套逻辑回归模型

我的问题 我想建立一个具有高 AUC 的逻辑回归模型来预测二元变量. 我想使用以下方法(如果可行): 使用弹性网络模型 (glmnet) 减少预测变量并找到最佳超参数(alpha 和 lambda) 在逻辑回归模型 (=finalmodelsuperdoc 的意见)相结合/code>),类似于第 26 页中所述: Afshar P、Mohammadi A、Platan ..
发布时间:2021-07-03 18:34:21 其他开发

使用 ROCR 和 pROC (R) 计算平均 AUC 的差异

我正在处理使用 caret 包生成的 SVM-RFE 模型的交叉验证数据(10 倍重复 5 次).我知道在计算指标时 caret 包与 pROC 包一起工作,但我需要使用 ROCR 包以获得平均 ROC.但是,我注意到使用每个包时平均 AUC 值并不相同,所以我不确定是否应该模糊地使用这两个包. 我用来证明的代码是: predictions_NG3 结果略有不同: auc_mean_ ..
发布时间:2021-07-03 18:33:52 其他开发

不同的结果 roc_auc_score 和 plot_roc_curve

我正在训练一个 RandomForestClassifier (sklearn) 来预测信用卡欺诈.当我测试模型并检查 rocauc 分数时,当我使用 roc_auc_score 和 plot_roc_curve 时,我得到了不同的值.roc_auc_score 给我大约 0.89,而 plot_curve 计算出的 AUC 为 0.96,这是为什么? 标签都是 0 和 1,预测是 0 或 ..
发布时间:2021-07-02 20:07:27 其他开发

如何用张量流计算AUC?

我已经使用 Tensorflow 构建了一个二元分类器,现在我想使用 AUC 和准确性来评估分类器. 就准确性而言,我可以很容易地这样做: X = tf.placeholder('float', [None, n_input])y = tf.placeholder('float', [None, n_classes])pred = mlp(X,权重,偏差,dropout_keep_prob ..
发布时间:2021-06-26 20:48:02 其他开发

Python:在x中以不均匀的步长积分曲线下面积

我有一个 y 值列表和一个 x 值列表.我想找到由这些点定义的曲线下的面积.对于具有均匀间距的 x 值,我找到了几个解决此问题的方法: 1) 给定一组坐标,在不知道函数的情况下计算曲线下的面积 2) 使用scipy对样本进行离散积分 但是当 x 值不均匀分布时,这两种方法都不起作用. 例如: >>>从 scipy.integrate 导入 simps>>>y = np.a ..
发布时间:2021-06-26 19:39:28 Python

partial_fit 与 SGDClassifier 给出了波动的准确度

我的数据在一个稀疏矩阵中.在开始大计算之前,我现在首先处理具有约 500k 行的子集.数据是二元数加上熵和字符串长度,完整的数据集包含数百万行乘以 1400 列.该模型旨在帮助表征这些字符串,因此我使用 SGDClassifier 进行逻辑回归. 由于尺寸较大,我决定在我的 SGDClassifier 上使用 partial_fit,但是我得到的计算出的 area-under-curve 值 ..
发布时间:2021-06-14 19:44:52 Python

从scikit-learn(sklearn)中的多类数据计算AUC和ROC曲线?

我正在尝试使用 scikit-learn 模块来计算AUC并绘制ROC曲线,以输出三个不同分类器的输出,以比较其性能.我对这个主题还很陌生,我正在努力了解如何将我的数据输入到 auc 函数. 对于测试集中的每个项目,我都有三个分类器中每个分类器的真实值和输出.这些类是 ['N','L','W','T'] .另外,对于分类器输出的每个值,我都有一个置信度得分.如何将这些信息传递给roc_cur ..
发布时间:2021-05-31 18:36:41 AI人工智能