如何使用statsModels.formula.api(Python)预测新值 [英] How to predict new values using statsmodels.formula.api (python)
本文介绍了如何使用statsModels.formula.api(Python)预测新值的处理方法,对大家解决问题具有一定的参考价值,需要的朋友们下面随着小编来一起学习吧!
问题描述
我使用来自乳腺癌数据的以下内容训练Logistic模型,并且只使用了一个特征‘Mean_Area’
from statsmodels.formula.api import logit
logistic_model = logit('target ~ mean_area',breast)
result = logistic_model.fit()
在训练好的模型中有一个内置的预测方法。然而,这给出了所有训练样本的预测值。如下所示
predictions = result.predict()
假设我想要一个新值的预测,比如30,我如何使用经过训练的模型来输出值?(而不是读取系数并手动计算)
推荐答案
您可以为.predict()
模型提供新值,如notebook文档中的输出#11所示。您可以将多个观察值作为2d array
提供,例如aDataFrame
-see docs。
由于您使用的是公式API,因此您的输入需要采用pd.DataFrame
的形式,以便列引用可用。在您的情况下,您可以使用类似.predict(pd.DataFrame({'mean_area': [1,2,3]})
的代码。
statsmodels
.predict()
仅在没有提供替代选项时使用用于拟合的观测值作为默认设置。
这篇关于如何使用statsModels.formula.api(Python)预测新值的文章就介绍到这了,希望我们推荐的答案对大家有所帮助,也希望大家多多支持IT屋!
查看全文