statistics - IT屋-程序员软件开发技术分享社区

Python统计数据模型：使用时间序列的ARIMA模型的帮助

统计模型公司的ARIMA对我的输出给出了不准确的答案。我想知道是否有人可以帮助我了解我的代码出了什么问题。这是一个示例： import pandas as pd import numpy as np import datetime as dt from statsmodels.tsa.arima_model import ARIMA # Setting up a data fram ..

发布时间：2022-08-31 11:35:03 python statistics statsmodels Python

如何解读更全面的测试结果？

我正在努力理解p值的概念和adfuler检验的其他各种结果。我使用的代码： (我在堆栈溢出中找到此代码) import numpy as np import os import pandas as pd import statsmodels.api as sm import cython import statsmodels.tsa.stattools as ts loc ..

发布时间：2022-08-31 11:13:43 statistics statsmodels 其他开发

找出在PCA之后我的组件中有哪些功能

我对我的数据执行了主成分分析。数据如下所示： df Out[60]: Drd1_exp1 Drd1_exp2 Drd1_exp3 ... M7_pppp M7_puuu Brain_Region 0 -1.0 -1.0 -1.0 ... 0.0 0.0 BaGr 3 ..

发布时间：2022-08-28 21:58:16 python pandas scikit-learn statistics pca Python

如何对数据帧中的多列进行循环Bartlett检验和Kruskal检验？

我有以下数据框我正在调用"；test"；，并且我正在尝试对每个"；metab"；与诊断&p>运行Bartlett‘s检验和Kruskal-Wallis检验。 > test Index tube.label age gender diagnosis metab1 metab2 metab3 metab4 metab5 metab6 1 ..

发布时间：2022-07-24 12:14:57 r for-loop statistics kruskal-wallis 其他开发

使用PyTorch计算用于分类和回归的95%可信区间的正确方法是什么？

我想使用PyTorch报告我的数据的90、95、99等可信区间。但置信度间隔似乎太重要了，不能让我的实现未经测试或受到批评，所以我希望得到反馈-至少应该由一些专家进行检查。此外，我已经注意到，当我的值为负值时，我得到了NaN值，这让我认为我的代码只适用于分类(至少)，但我也会进行回归。我还感到惊讶的是，直接使用NumPy代码实际上给了我可微的张量……这是我意想不到的。那么这是正确的吗？： ..

发布时间：2022-07-24 09:48:32 python machine-learning pytorch statistics pytorch-lightning AI人工智能

将首位数字相似的变量聚合在一起

在下表中，每一项都有一个两位数的代码。第一个数字表示类别。我希望使用Stata聚合每个人具有相同第一位数字的项目。因此，解决方案将是：在此表中，item1=item11+item14+item15+item17和item2=item21+item25按每人计算。推荐答案 clear input str1 person item11 item21 item14 item1 ..

发布时间：2022-07-15 12:33:07 statistics stata 其他开发

空间分离的蒙特卡罗检验

我很难解释我从spatstat中的隔离.test方法得到的结果。然而，我有三个不同的点模式A，B，C，我想证明C和B是相关的，而A和B不是。您可以在此图中看到强度的核估计：但是使用spatstat包在R中计算它，我总是得到相同的p值，尽管测试统计T是不同的…这怎麽可能？在这种情况下，测试统计数据T意味着什么？为什么我会得到完全相同的p值？我希望你能帮助我在这次蒙特卡洛测试中做错了什 ..

发布时间：2022-05-29 22:46:20 r statistics spatial montecarlo spatstat 其他开发

我的问题涉及统计学和Python，我在这两方面都是初学者。我正在运行一个模拟，对于自变量(X)的每个值，我为因变量(Y)生成1000个值。我所做的是为X的每个值计算Y的平均值，并使用scipy.Optimize.curveFit对这些平均值进行拟合。这条曲线很好地拟合了，但我也想画出可信区间。我不确定我正在做的事情是否正确，或者我想要做的事情是否可以完成，但我的问题是如何从Curve_Fit生成的 ..

发布时间：2022-05-23 16:20:22 python python-3.x scipy statistics curve-fitting Python

有没有办法适当地调整这个逻辑回归函数，以说明多个自变量和固定效应？

我想对下面包含的LogitRegress函数进行修改，以包括其他自变量和固定效果。以下代码改编自此处提供的答案：how to use sklearn when target variable is a proportion from sklearn.linear_model import LinearRegression from random import choices from ..

发布时间：2022-04-19 21:45:14 python machine-learning scikit-learn statistics logistic-regression AI人工智能

试读产生泊松随机变量的逆变换法

Wikipedia给出的使用逆变换方法生成泊松分布随机变量的算法是： init: Let x ← 0, p ← e^−λ, s ← p. Generate uniform random number u in [0,1]. while u > s do: x ← x + 1. p ← p * λ / x. s ← s + p. return ..

发布时间：2022-04-06 22:44:47 r algorithm statistics simulation distribution 其他开发

将汇总信息添加到使用ggploy创建的密度图

我有一个密度图，我想添加一些汇总信息，例如在中位数放置一条线，并对90%可信区间(第五和第95个分位数)加阴影。是否有办法在ggploy中执行此操作？这是我想要总结的情节类型：我可以计算出如何从y=0到y=密度(中值(X))画一条线，但我不清楚是否可以用90%的CI对曲线图进行阴影处理。或者，我可以在密度图的上方添加一个水平的框图，但不清楚如何旋转框图本身，而不旋转密度图。 ..

发布时间：2022-04-02 20:09:01 r statistics visualization ggplot2 其他开发

动态变量选择在shinyApp中的回归

我希望对FEATURE_A执行线性回归，并希望用户动态选择另一个变量。我还想显示有关我的整体预测模型拟合调整后的R2、每个模型估计的参数系数和系数p值的统计信息。下面是我能想到的。不用说，这是行不通的。我一直在努力解决这个问题，任何帮助我都将不胜感激。 library(shiny) library(ggplot2) library(dplyr) library(purrr) ..

发布时间：2022-03-24 22:14:19 r shiny statistics regression linear-regression 其他开发

回归模型统计信息model python

这更多的是一个统计问题，因为代码运行良好，但我正在学习Python中的回归建模。我使用statsmodel编写了以下代码来创建一个简单的线性回归模型： import statsmodels.api as sm import numpy as np import pandas as pd import matplotlib.pyplot as plt ng = pd.read_csv('C: ..

发布时间：2022-03-24 21:53:57 python statistics linear-regression statsmodels Python

求两个直方图的卷积

两个随机变量x和y的和的概率分布由单个分布的卷积给出。我在做这个数字时遇到了一些困难。在下面的示例中，x和y是均匀分布的，它们各自的分布近似为直方图。我的推理是直方图应该卷积以得到x+y的分布。 from numpy.random import uniform from numpy import ceil,convolve,histogram,sqrt from pylab import h ..

发布时间：2022-03-15 17:00:28 statistics numpy probability histogram convolution Python

同时对R中的整齐数据执行多个t.test

我有一个数据集，如下所示： id samediff factor value 1 S give 3 1 S impact 4 2 S give 2 2 S impact 5 3 D give 1 3 D impact 4 4 D ..

发布时间：2022-02-28 19:59:52 r statistics tidyr tidyverse 其他开发

由于R：'；中的日期失败，字符串不是标准的明确的'；

我正在使用我导入的表单excel格式的R数据。我在数据帧(LPAv1.1.1)中有一列(isas1_3b)，其格式为character。导入时，日期已从dd/mm/yy格式更改为天数(例如，41268)。我已尝试按如下方式转换： as.Date(LPAv1.1.1$isas1_3b, origin = "1899-12-30") 但是，我收到以下错误： charToDa ..

发布时间：2022-02-23 13:27:43 r excel date statistics 其他开发

如何在R中反双曲正弦变换？

使用反双曲正弦变换的变换可以使用以下简单函数在R中完成： ihs ..

发布时间：2022-02-23 13:25:40 r statistics 其他开发

统计分析和报告撰写的工作流程

是否有人对与自定义报告编写相关的数据分析工作流程有任何智慧?用例基本上是这样的: 客户委托使用数据分析的报告，例如一个水域的人口估计和相关地图. 分析师下载一些数据，整理数据并保存结果(例如，为每单位人口添加一列，或根据地区边界对数据进行子集). 分析师分析在 (2) 中创建的数据，接近她的目标，但认为需要更多数据，因此返回 (1). 冲洗重复，直到表格和图形满足 QA ..

发布时间：2022-01-30 22:48:00 r statistics data-visualization 其他开发

在 C 中生成 INTEGERS 的均匀分布

我编写了一个 C 函数，我认为该函数从均匀分布中选择整数，范围为 [rangeLow, rangeHigh]，包括在内.这不是家庭作业——我只是在一些嵌入式系统中使用它来做一些有趣的事情. 在我的测试用例中，此代码似乎产生了适当的分布.不过，我并不完全相信实施是正确的.如果我在这里做错了什么，有人可以进行完整性检查并告诉我吗? //uniform_distribution 在 [ra ..

发布时间：2022-01-24 08:42:56 c algorithm statistics integer uniform 其他开发

两个 beta 分布的乘积

假设我有两个随机变量: X ~ Beta(α1,β1) Y ~ Beta(α2,β2) 我想计算 Z = XY(随机变量的乘积)的分布使用 scipy，我可以获得单个 Beta 版的 pdf: 从 scipy.stats 导入 betarv = beta(a, b)x = np.linspace(start=0, stop=1, num=200)my_pdf = rv. ..

发布时间：2022-01-23 19:51:05 python r statistics julia statsmodels Python

statistics相关内容