statistics相关内容
统计模型公司的ARIMA对我的输出给出了不准确的答案。我想知道是否有人可以帮助我了解我的代码出了什么问题。 这是一个示例: import pandas as pd import numpy as np import datetime as dt from statsmodels.tsa.arima_model import ARIMA # Setting up a data fram
..
我正在努力理解p值的概念和adfuler检验的其他各种结果。 我使用的代码: (我在堆栈溢出中找到此代码) import numpy as np import os import pandas as pd import statsmodels.api as sm import cython import statsmodels.tsa.stattools as ts loc
..
我对我的数据执行了主成分分析。数据如下所示: df Out[60]: Drd1_exp1 Drd1_exp2 Drd1_exp3 ... M7_pppp M7_puuu Brain_Region 0 -1.0 -1.0 -1.0 ... 0.0 0.0 BaGr 3
..
我有以下数据框我正在调用";test";,并且我正在尝试对每个";metab";与诊断&p>运行Bartlett‘s检验和Kruskal-Wallis检验。 > test Index tube.label age gender diagnosis metab1 metab2 metab3 metab4 metab5 metab6 1
..
我想使用PyTorch报告我的数据的90、95、99等可信区间。但置信度间隔似乎太重要了,不能让我的实现未经测试或受到批评,所以我希望得到反馈-至少应该由一些专家进行检查。此外,我已经注意到,当我的值为负值时,我得到了NaN值,这让我认为我的代码只适用于分类(至少),但我也会进行回归。我还感到惊讶的是,直接使用NumPy代码实际上给了我可微的张量……这是我意想不到的。 那么这是正确的吗?:
..
在下表中,每一项都有一个两位数的代码。第一个数字表示类别。 我希望使用Stata聚合每个人具有相同第一位数字的项目。因此,解决方案将是: 在此表中,item1=item11+item14+item15+item17和item2=item21+item25按每人计算。 推荐答案 clear input str1 person item11 item21 item14 item1
..
我很难解释我从spatstat中的隔离.test方法得到的结果。然而,我有三个不同的点模式A,B,C,我想证明C和B是相关的,而A和B不是。您可以在此图中看到强度的核估计: 但是使用spatstat包在R中计算它,我总是得到相同的p值,尽管测试统计T是不同的…这怎麽可能?在这种情况下,测试统计数据T意味着什么?为什么我会得到完全相同的p值? 我希望你能帮助我在这次蒙特卡洛测试中做错了什
..
我的问题涉及统计学和Python,我在这两方面都是初学者。我正在运行一个模拟,对于自变量(X)的每个值,我为因变量(Y)生成1000个值。我所做的是为X的每个值计算Y的平均值,并使用scipy.Optimize.curveFit对这些平均值进行拟合。这条曲线很好地拟合了,但我也想画出可信区间。我不确定我正在做的事情是否正确,或者我想要做的事情是否可以完成,但我的问题是如何从Curve_Fit生成的
..
我想对下面包含的LogitRegress函数进行修改,以包括其他自变量和固定效果。 以下代码改编自此处提供的答案:how to use sklearn when target variable is a proportion from sklearn.linear_model import LinearRegression from random import choices from
..
Wikipedia给出的使用逆变换方法生成泊松分布随机变量的算法是: init: Let x ← 0, p ← e^−λ, s ← p. Generate uniform random number u in [0,1]. while u > s do: x ← x + 1. p ← p * λ / x. s ← s + p. return
..
我有一个密度图,我想添加一些汇总信息,例如在中位数放置一条线,并对90%可信区间(第五和第95个分位数)加阴影。是否有办法在ggploy中执行此操作? 这是我想要总结的情节类型: 我可以计算出如何从y=0到y=密度(中值(X))画一条线,但我不清楚是否可以用90%的CI对曲线图进行阴影处理。或者,我可以在密度图的上方添加一个水平的框图,但不清楚如何旋转框图本身,而不旋转密度图。
..
我希望对FEATURE_A执行线性回归,并希望用户动态选择另一个变量。我还想显示有关我的整体预测模型拟合调整后的R2、每个模型估计的参数系数和系数p值的统计信息。 下面是我能想到的。不用说,这是行不通的。我一直在努力解决这个问题,任何帮助我都将不胜感激。 library(shiny) library(ggplot2) library(dplyr) library(purrr)
..
这更多的是一个统计问题,因为代码运行良好,但我正在学习Python中的回归建模。我使用statsmodel编写了以下代码来创建一个简单的线性回归模型: import statsmodels.api as sm import numpy as np import pandas as pd import matplotlib.pyplot as plt ng = pd.read_csv('C:
..
两个随机变量x和y的和的概率分布由单个分布的卷积给出。我在做这个数字时遇到了一些困难。在下面的示例中,x和y是均匀分布的,它们各自的分布近似为直方图。我的推理是直方图应该卷积以得到x+y的分布。 from numpy.random import uniform from numpy import ceil,convolve,histogram,sqrt from pylab import h
..
我有一个数据集,如下所示: id samediff factor value 1 S give 3 1 S impact 4 2 S give 2 2 S impact 5 3 D give 1 3 D impact 4 4 D
..
我正在使用我导入的表单excel格式的R数据。 我在数据帧(LPAv1.1.1)中有一列(isas1_3b),其格式为character。导入时,日期已从dd/mm/yy格式更改为天数(例如,41268)。 我已尝试按如下方式转换: as.Date(LPAv1.1.1$isas1_3b, origin = "1899-12-30") 但是,我收到以下错误: charToDa
..
使用反双曲正弦变换的变换可以使用以下简单函数在R中完成: ihs
..
是否有人对与自定义报告编写相关的数据分析工作流程有任何智慧?用例基本上是这样的: 客户委托使用数据分析的报告,例如一个水域的人口估计和相关地图. 分析师下载一些数据,整理数据并保存结果(例如,为每单位人口添加一列,或根据地区边界对数据进行子集). 分析师分析在 (2) 中创建的数据,接近她的目标,但认为需要更多数据,因此返回 (1). 冲洗重复,直到表格和图形满足 QA
..
我编写了一个 C 函数,我认为该函数从 均匀分布 中选择 整数,范围为 [rangeLow, rangeHigh],包括在内.这不是家庭作业——我只是在一些嵌入式系统中使用它来做一些有趣的事情. 在我的测试用例中,此代码似乎产生了适当的分布.不过,我并不完全相信实施是正确的.如果我在这里做错了什么,有人可以进行完整性检查并告诉我吗? //uniform_distribution 在 [ra
..
假设我有两个随机变量: X ~ Beta(α1,β1) Y ~ Beta(α2,β2) 我想计算 Z = XY(随机变量的乘积)的分布 使用 scipy,我可以获得单个 Beta 版的 pdf: 从 scipy.stats 导入 betarv = beta(a, b)x = np.linspace(start=0, stop=1, num=200)my_pdf = rv.
..