预测分析-“为什么"因子&模型的可解释性 [英] Predictive Analytics - "why" factor & model interpretability

查看:277
本文介绍了预测分析-“为什么"因子&模型的可解释性的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我拥有包含大量x变量的数据,这些变量主要是分类/标称的,而我的目标变量是一个多类标签.我能够建立几个模型来预测多类变量并比较每个变量的执行情况.我有训练和测试数据.培训和测试数据都给了我很好的结果.

现在,我试图找出为什么"该模型预测了某些Y变量?表示是否有天气数据:X变量:城市,州,邮政编码,温度,年份; Y变量:雨,太阳,阴天,雪.我想找出模型为什么要预测的原因":分别是降雨,阳光,多云或下雪.我使用了多名词,决策树等分类算法.

这可能是一个广泛的问题,但我需要一个可以开始研究的地方.我可以预测什么",但看不到它被预测为雨,日,多云或下雪的标签"的原因".基本上,我试图找到导致预测变量的变量之间的链接.

到目前为止,我考虑过使用相关矩阵,主成分分析(在模型构建过程中发生)...至少是要看看哪些是好的预测变量,而哪些不是.有没有办法弄清楚为什么"因素?

感谢一堆!

解决方案

模型可解释性是当前研究(例如圣杯之类的东西)活跃度很高且非常热门的领域,近年来,由于深度学习模型在各种任务中的成功(通常是巨大的成功),加上算法公平性和可操作性的必要性,已经提出了这一点.问责制...

除了深入的理论研究之外,还有一些工具箱和工具箱.最近在实用级别上的库,既用于神经网络,也用于其他常规ML模型;以下是部分清单,可以说应该让您忙一段时间:

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆