statsmodels相关内容
因此,如果我对多个处理组和一个对照组进行实验,我会使用统计模型工具分析结果,看看是否有任何一个处理组与对照组有统计学差异: y~C(处理_组,处理(‘对照’)) 然后,我将运行Results.t_test_pairwise(),以确定每个处理组的系数是否相等。即了解每个处理组的结果是否在统计学上显著不同。 在当前情况下,我使用的是StatsModel/LinearModel的2SLS
..
我需要一些建议,如何更快地编写代码来解决我的问题。我正在研究如何计算空间(X,Y,Z)中的点之间的相关性,其中对于每个点,我有随时间变化的速度数据,理想情况下,我希望每个点P1计算与所有其他点的速度相关性。 最后,我希望有一个矩阵,对于每一对坐标(X1,Y1,Z1),(X2,Y2,Z2),我得到皮尔逊相关系数。我不完全确定如何用Python语言最好地组织这项工作。到目前为止,我所做的是定义了不同
..
是否可以在statsModels中实现如Bayesian Filtering and Smoothing示例3.6中所示的模型? 我可以按照提供的MatLab代码进行操作,但我不确定是否以及如何在statsModels中实现这种模型。 该示例涉及跟踪对象在2D空间中的位置。状态是四维的x=(x_1, x_2, x_3, x_4),但我重新排列了矢量,使(x_1, x_3)表示位置,(x
..
是否可以限制SCRICKIT-LEARN或STATSMODEL中的线性回归调整参数的范围,例如,在statsModels.regression.line_Model.OLS或sklearn.linearModel.LinearRegress中? http://statsmodels.sourceforge.net/devel/generated/statsmodels.regression.
..
我正在对两组数据Y和X执行OLS。我使用statsmod.api.OLS。然而,我发现无论我之前是否向X添加一个常量,结果都非常不同。代码如下: import statsmodels.api as sm import numpy as np mess = "SELECT .... FROM... WHERE ...." data = np.array(db.extractData(mess
..
我在(Python)statsmodels库中的ccf()方法遇到了一些问题。等效操作在R中运行良好 ccf在我的示例中产生两个变量A和B之间的互相关函数。我有兴趣了解A在多大程度上是B的领先指标。 我正在使用以下内容: import pandas as pd import numpy as np import statsmodels.tsa.stattools as smt
..
我正在使用SkLearning和statsModel执行线性回归。 我知道SkLearning和statsModel产生的结果是一样的。如下图所示,SkLearning和statsModels得出的结果是相同的,但在SkLearning中使用fit_intercept=False截距为零时,即使系数相同,结果也不同。 你能解释一下原因吗?或者当我在SkLearning中使用fit_in
..
我对Python和编程一般都是新手,所以请原谅任何简单的错误/应该很明显的事情。 我想要做的很简单,我只想将一种线性趋势(一维多项式)与一系列时间序列进行拟合,看看斜率是正还是负。现在,我只是想让它在一个时间序列中发挥作用。 问题: pandas 和麻木似乎都不能回归约会时间。我的约会时间不固定(通常为每月1天,但不是同一天),因此无法使用Linear Regression from Ti
..
统计模型公司的ARIMA对我的输出给出了不准确的答案。我想知道是否有人可以帮助我了解我的代码出了什么问题。 这是一个示例: import pandas as pd import numpy as np import datetime as dt from statsmodels.tsa.arima_model import ARIMA # Setting up a data fram
..
我会使用(StatsModels)ARIMA来预测序列中的值: plt.plot(ind, final_results.predict(start=0 ,end=26)) plt.plot(ind, forecast.values) plt.show() 我以为我会从这两个图中得到相同的结果,但结果却是这样的: 我想知道问题是关于预测还是预测 推荐答案 从图表上看,您似
..
我正在努力理解p值的概念和adfuler检验的其他各种结果。 我使用的代码: (我在堆栈溢出中找到此代码) import numpy as np import os import pandas as pd import statsmodels.api as sm import cython import statsmodels.tsa.stattools as ts loc
..
我有以下代码 from statsmodels.graphics.factorplots import interaction_plot import statsmodels.api as sm import matplotlib.pyplot as plt # ... fig1 = interaction_plot(a, b, c, colors=['red', 'blue'], ma
..
我正在对布尔0/1数据集进行Logistic回归(预测某个年龄超过某个金额的工资的概率),并且我使用sklearn和StatsModels得到了非常不同的结果,而skLearning是非常错误的。 为了使该函数更类似于StatsModels,我已将skLearning惩罚设置为None,并将Intercept Term设置为False,但我看不到如何让skLearning给出合理的答案。
..
我使用来自乳腺癌数据的以下内容训练Logistic模型,并且只使用了一个特征‘Mean_Area’ from statsmodels.formula.api import logit logistic_model = logit('target ~ mean_area',breast) result = logistic_model.fit() 在训练好的模型中有一个内置的预测方法。然而
..
这更多的是一个统计问题,因为代码运行良好,但我正在学习Python中的回归建模。我使用statsmodel编写了以下代码来创建一个简单的线性回归模型: import statsmodels.api as sm import numpy as np import pandas as pd import matplotlib.pyplot as plt ng = pd.read_csv('C:
..
我已经开发了一个算法来遍历15个变量,并为每个变量生成一个简单的OLS。然后,算法再循环11次,以产生相同的15个OLS回归,但X变量的滞后每次增加一个。我选择r^2最高的自变量,并对3、4或5个变量使用最佳滞后 即 Y_t+1 - Y_t = B ( X_t+k - X_t) + e 我的数据集如下所示: Regression = pd.DataFrame(np.rando
..
现在,我正在尝试使用statsmods.formula.api的quantreg,方法是将公式和数据帧放入,就像https://www.statology.org/quantile-regression-in-python/一样。但是,我找不到如何以获取多个独立值的方式构造公式,我尝试了使用‘xValue1,xValue2~yValue’的结构,但是这会导致行不匹配错误,使我认为statsmode
..
在使用statsmodel时,我收到了这个奇怪的错误:ValueError: endog must be in the unit interval.有人能给我提供有关此错误的更多信息吗?谷歌帮不上忙。 产生错误的代码: """ Multiple regression with dummy variables. """ import pandas as pd import stats
..
我一直在使用 Python 进行回归分析.得到回归结果后,我需要将所有结果汇总到一个表中,并将它们转换为 LaTex(用于发布).是否有任何包可以在 Python 中执行此操作?Stata 中的 estout 之类的东西给出了下表: 解决方案 嗯,statsmodels里面有summary_col;它没有 estout 的所有花里胡哨,但它确实具有您正在寻找的基本功能(包括导出到 LaTe
..
我是 latex 新手,我想将 statsmodels(python-package) 摘要导入到我的乳胶报告.我发现可以使用以下方法将摘要转换为乳胶表格:latex_as_tabular.到目前为止,一切正常.现在我必须存储表格,但我不太明白它是如何工作的. 我想我必须使用以下命令: x_values=sm.add_constant(x_values)模型=sm.OLS(y_values
..