如何使用statsModels.formula.api(Python)预测新值 [英] How to predict new values using statsmodels.formula.api (python)

查看:15
本文介绍了如何使用statsModels.formula.api(Python)预测新值的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!

问题描述

我使用来自乳腺癌数据的以下内容训练Logistic模型,并且只使用了一个特征‘Mean_Area’

from statsmodels.formula.api import logit
logistic_model = logit('target ~ mean_area',breast)
result = logistic_model.fit()

在训练好的模型中有一个内置的预测方法。然而,这给出了所有训练样本的预测值。如下所示

predictions = result.predict()
假设我想要一个新值的预测,比如30,我如何使用经过训练的模型来输出值?(而不是读取系数并手动计算)

推荐答案

您可以为.predict()模型提供新值,如notebook文档中的输出#11所示。您可以将多个观察值作为2d array提供,例如aDataFrame-see docs

由于您使用的是公式API,因此您的输入需要采用pd.DataFrame的形式,以便列引用可用。在您的情况下,您可以使用类似.predict(pd.DataFrame({'mean_area': [1,2,3]})的代码。

statsmodels.predict()仅在没有提供替代选项时使用用于拟合的观测值作为默认设置。

这篇关于如何使用statsModels.formula.api(Python)预测新值的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!

查看全文
登录 关闭
扫码关注1秒登录
发送“验证码”获取 | 15天全站免登陆