statistics相关内容

如何解读更全面的测试结果?

我正在努力理解p值的概念和adfuler检验的其他各种结果。 我使用的代码: (我在堆栈溢出中找到此代码) import numpy as np import os import pandas as pd import statsmodels.api as sm import cython import statsmodels.tsa.stattools as ts loc ..
发布时间:2022-08-31 11:13:43 其他开发

使用PyTorch计算用于分类和回归的95%可信区间的正确方法是什么?

我想使用PyTorch报告我的数据的90、95、99等可信区间。但置信度间隔似乎太重要了,不能让我的实现未经测试或受到批评,所以我希望得到反馈-至少应该由一些专家进行检查。此外,我已经注意到,当我的值为负值时,我得到了NaN值,这让我认为我的代码只适用于分类(至少),但我也会进行回归。我还感到惊讶的是,直接使用NumPy代码实际上给了我可微的张量……这是我意想不到的。 那么这是正确的吗?: ..

将首位数字相似的变量聚合在一起

在下表中,每一项都有一个两位数的代码。第一个数字表示类别。 我希望使用Stata聚合每个人具有相同第一位数字的项目。因此,解决方案将是: 在此表中,item1=item11+item14+item15+item17和item2=item21+item25按每人计算。 推荐答案 clear input str1 person item11 item21 item14 item1 ..
发布时间:2022-07-15 12:33:07 其他开发

空间分离的蒙特卡罗检验

我很难解释我从spatstat中的隔离.test方法得到的结果。然而,我有三个不同的点模式A,B,C,我想证明C和B是相关的,而A和B不是。您可以在此图中看到强度的核估计: 但是使用spatstat包在R中计算它,我总是得到相同的p值,尽管测试统计T是不同的…这怎麽可能?在这种情况下,测试统计数据T意味着什么?为什么我会得到完全相同的p值? 我希望你能帮助我在这次蒙特卡洛测试中做错了什 ..
发布时间:2022-05-29 22:46:20 其他开发

如何从Curve_Fit中获得置信度区间

我的问题涉及统计学和Python,我在这两方面都是初学者。我正在运行一个模拟,对于自变量(X)的每个值,我为因变量(Y)生成1000个值。我所做的是为X的每个值计算Y的平均值,并使用scipy.Optimize.curveFit对这些平均值进行拟合。这条曲线很好地拟合了,但我也想画出可信区间。我不确定我正在做的事情是否正确,或者我想要做的事情是否可以完成,但我的问题是如何从Curve_Fit生成的 ..
发布时间:2022-05-23 16:20:22 Python

有没有办法适当地调整这个逻辑回归函数,以说明多个自变量和固定效应?

我想对下面包含的LogitRegress函数进行修改,以包括其他自变量和固定效果。 以下代码改编自此处提供的答案:how to use sklearn when target variable is a proportion from sklearn.linear_model import LinearRegression from random import choices from ..

将汇总信息添加到使用ggploy创建的密度图

我有一个密度图,我想添加一些汇总信息,例如在中位数放置一条线,并对90%可信区间(第五和第95个分位数)加阴影。是否有办法在ggploy中执行此操作? 这是我想要总结的情节类型: 我可以计算出如何从y=0到y=密度(中值(X))画一条线,但我不清楚是否可以用90%的CI对曲线图进行阴影处理。或者,我可以在密度图的上方添加一个水平的框图,但不清楚如何旋转框图本身,而不旋转密度图。 ..
发布时间:2022-04-02 20:09:01 其他开发

动态变量选择在shinyApp中的回归

我希望对FEATURE_A执行线性回归,并希望用户动态选择另一个变量。我还想显示有关我的整体预测模型拟合调整后的R2、每个模型估计的参数系数和系数p值的统计信息。 下面是我能想到的。不用说,这是行不通的。我一直在努力解决这个问题,任何帮助我都将不胜感激。 library(shiny) library(ggplot2) library(dplyr) library(purrr) ..
发布时间:2022-03-24 22:14:19 其他开发

回归模型统计信息model python

这更多的是一个统计问题,因为代码运行良好,但我正在学习Python中的回归建模。我使用statsmodel编写了以下代码来创建一个简单的线性回归模型: import statsmodels.api as sm import numpy as np import pandas as pd import matplotlib.pyplot as plt ng = pd.read_csv('C: ..
发布时间:2022-03-24 21:53:57 Python

求两个直方图的卷积

两个随机变量x和y的和的概率分布由单个分布的卷积给出。我在做这个数字时遇到了一些困难。在下面的示例中,x和y是均匀分布的,它们各自的分布近似为直方图。我的推理是直方图应该卷积以得到x+y的分布。 from numpy.random import uniform from numpy import ceil,convolve,histogram,sqrt from pylab import h ..
发布时间:2022-03-15 17:00:28 Python

统计分析和报告撰写的工作流程

是否有人对与自定义​​报告编写相关的数据分析工作流程有任何智慧?用例基本上是这样的: 客户委托使用数据分析的报告,例如一个水域的人口估计和相关地图. 分析师下载一些数据,整理数据并保存结果(例如,为每单位人口添加一列,或根据地区边界对数据进行子集). 分析师分析在 (2) 中创建的数据,接近她的目标,但认为需要更多数据,因此返回 (1). 冲洗重复,直到表格和图形满足 QA ..
发布时间:2022-01-30 22:48:00 其他开发

在 C 中生成 INTEGERS 的均匀分布

我编写了一个 C 函数,我认为该函数从 均匀分布 中选择 整数,范围为 [rangeLow, rangeHigh],包括在内.这不是家庭作业——我只是在一些嵌入式系统中使用它来做一些有趣的事情. 在我的测试用例中,此代码似乎产生了适当的分布.不过,我并不完全相信实施是正确的.如果我在这里做错了什么,有人可以进行完整性检查并告诉我吗? //uniform_distribution 在 [ra ..
发布时间:2022-01-24 08:42:56 其他开发

两个 beta 分布的乘积

假设我有两个随机变量: X ~ Beta(α1,β1) Y ~ Beta(α2,β2) 我想计算 Z = XY(随机变量的乘积)的分布 使用 scipy,我可以获得单个 Beta 版的 pdf: 从 scipy.stats 导入 betarv = beta(a, b)x = np.linspace(start=0, stop=1, num=200)my_pdf = rv. ..
发布时间:2022-01-23 19:51:05 Python