什么时候微观和宏观平均值会有很大不同? [英] When do micro- and macro-averages differ a lot?

本文介绍了什么时候微观和宏观平均值会有很大不同?的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我正在学习机器学习理论。我有一个使用多类别Logistic回归的预测混淆矩阵。

现在我已经计算了微观和宏观平均值(精度和召回)。

值有很大不同。现在我想知道是什么因素影响了这一点。在什么情况下,微观和宏观会有很大的不同?

我注意到的是,对于不同的类别,预测的准确性是不同的。这就是原因吗?或者还有什么其他因素可以导致这种情况?

样本混淆矩阵:

和我计算的微观-宏观平均值:

precision-micro = ~0.7329
recall-micro = ~0,7329

precision-macro = ~0.5910
recall-macro = ~0.6795

推荐答案

微观平均值和宏观平均值之间的差异在不平衡的数据集中变得明显。

micro平均值是一种全局策略,它基本上忽略了类别之间的区别。它是通过计算所有类别的真阳性、假阴性和假阳性总数来计算的。

在基本问题不是多标签分类的分类任务中,微平均值实际上等于准确度分数。确保你的微精确度和查全率相等。计算准确度分数并进行比较,您将看不到任何差异。

macro平均值的情况下,分别计算每个标签的查准率和召回率,并将其报告为未加权平均值。根据您的分类器对每个类的执行方式,这可能会严重影响结果。

您也可以参考我的answer,这里已经详细介绍了它。

这篇关于什么时候微观和宏观平均值会有很大不同?的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆