statistics相关内容

迭代 numpy 数组列的所有成对组合

我有一个大小为 的 numpy 数组 arr.size = (200, 600, 20). 我想在最后两个维度的每个成对组合上计算 scipy.stats.kendalltau.例如: kendalltau(arr[:, 0, 0], arr[:, 1, 0])kendalltau(arr[:, 0, 0], arr[:, 1, 1])kendalltau(arr[:, 0, 0], ar ..
发布时间:2022-01-07 23:38:15 Python

ggvis 是否可以交互地更改 x 和 y 轴的变量?

有谁知道是否可以使用 ggvis 交互地更改 x 和 y 轴的变量?我可以更改数据点的大小、它们的位置和不透明度,但我无法确定是否可以允许用户从下拉列表中选择一个变量,该变量将成为 x/y 轴的数据. 解决方案 ggvis 包旨在与 dplyr 结合使用,例如来总结数据.dplyr 包还重新导出了 magrittr 管道运算符(%>%,请参阅 README.md),这使得使用 ggvis' 实 ..
发布时间:2022-01-07 23:37:23 其他开发

在 Excel 数据透视表中使用 QUARTILE 按子群汇总数据

我在 Excel 电子表格中有一个很大的数据表,从本质上讲,它可以被认为是被识别为属于不同亚群的个人的值的集合: IndivID SubPopID 值1 A 33.562 东 42.313D 16.354 50.595 华氏度 80.63... 此表中有 10,000 多个个体,以及 50 多个亚群. 我想计算每个亚群的 5 数汇总(最小值、Q1、中值、Q3、最大值). Min ..
发布时间:2022-01-07 23:37:15 其他开发

如何用数据百分比作为每个波段/箱中的标签绘制正态分布?

在绘制数据的正态分布图时,我们如何使用 matplotlib/seaborn 或 plotly 为每个条带宽度为 1 标准差的每个 bin 中的数据百分比放置如下图所示的标签? 目前,我是这样绘制的: hmean = np.mean(data)hstd = np.std(数据)pdf = stats.norm.pdf(数据,hmean,hstd)plt.plot(数据,pdf) 解决方案 ..
发布时间:2022-01-07 23:37:09 Python

python scipy.stats.powerlaw 负指数

我想为 scipy.stats.powerlaw 例程提供负指数,例如a=-1.5,为了抽取随机样本: """powerlaw.pdf(x, a) = a * x**(a-1)"""从 scipy.stats 导入幂律R = powerlaw.rvs(a, size=100) 为什么需要 > 0,我如何提供负 a 以生成随机样本,以及如何提供归一化系数/变换,即 PDF(x,C,a) = C ..
发布时间:2022-01-07 23:37:00 Python

Python 中 cor.test 的 R 等价物

有没有办法在 Python 中找到 r 置信区间? 在 R 中,我可以执行以下操作: cor.test(m, h)Pearson 的乘积-矩相关性数据:m 和 ht = 0.8974,df = 4,p 值 = 0.4202备择假设:真正的相关性不等于 095% 置信区间:-0.6022868 0.9164582样本估计:科尔0.4093729 在 Python 中,我可以使用以下方法计算 ..
发布时间:2022-01-07 23:36:53 Python

Python:从经验分布中生成随机值

在 Java 中,我通常依赖于 org.apache.commons.math3.random.EmpiricalDistribution 类执行以下操作: 从观察到的数据中推导出概率分布. 从此分布生成随机值. 是否有提供相同功能的 Python 库?看起来像 scipy.stats.gaussian_kde.resample 做了类似的事情,但我不确定它是否实现了与我熟悉的 Ja ..
发布时间:2022-01-07 23:36:42 Python

Hotelling 在 Python 中的 T^2 分数

我在 python 中使用 matplotlib 对数据集应用了 pca.但是,matplotlib 不像 Matlab 那样提供 t 平方分数.有没有办法像 Matlab 一样计算 Hotelling 的 T^2 分数? 谢谢. 解决方案 matplotlib 的 PCA 类不包括 Hotelling T2 计算,但只需几行代码即可完成.以下代码包含一个函数,用于计算每个点的 T2 ..
发布时间:2022-01-07 23:36:15 Python

如何在 Python 中将一系列浮点值合并到直方图中?

我有一组浮点值(总是小于 0).我想将其放入直方图中,IE.直方图中的每个条形都包含值范围 [0,0.150) 我拥有的数据如下所示: 0.0000.0050.1240.0000.0040.0000.1110.112 在我下面的代码中,我希望得到看起来像这样的结果 [0, 0.005) 5[0.005, 0.011) 0...等等.. 我试图用我的这段代码做这样的分箱.但它似乎不起作 ..
发布时间:2022-01-07 23:35:50 Python

自动化无聊的东西 - 硬币翻转条纹

我知道现在有很多关于它的问题,即使是同样的问题,但我想我尝试了一些不同的方法. 任务是对 10.000 个样本进行 100 次翻转,然后计算所有样本出现 6 次正面或反面连续的概率 - 据我所知.但在之前的问题中,编码问题被描述为有点模糊.因此,如果你们能指出代码中的错误,那就太好了:) 我尽量保持懒惰,这导致我的 macbook 非常努力地工作.这是我的代码.我对当前值与之前值比较的 ..
发布时间:2022-01-07 23:35:17 其他开发

R中var-covar矩阵的高效计算

我正在寻找通过 t, t-1 等随时间t 的单个测量计算(自动)协方差矩阵的效率增益.> 在数据矩阵中,每一行代表一个人,每一列代表每月的测量值(列按时间顺序排列).类似于以下数据(尽管有更多的协方差). #模拟数据set.seed(1)周期 下面是我想出的(丑陋的)代码来获得测量/滞后测量的协方差矩阵.运行大约需要 4 秒.我确信通过移动到 data.table,多思考而不依赖循环,我可以 ..
发布时间:2022-01-07 23:34:27 其他开发

Python:在python中做几何平均值的简单方法?

我想知道有没有什么简单的方法可以使用 python 但不使用 python 包来做几何平均.如果没有,有没有简单的包来做几何平均? 解决方案 几何均值的公式为: 因此您可以轻松编写如下算法: 将 numpy 导入为 npdef geo_mean(可迭代):a = np.array(iterable)返回 a.prod()**(1.0/len(a)) 您不必为此使用 numpy,但 ..
发布时间:2022-01-07 23:34:12 Python

如何使用 R 在散点图上绘制 R 平方值?

这似乎是一个简单的问题,所以我希望它是一个简单的答案.我正在绘制我的点并拟合线性模型,我可以做到.然后,我还想在图上绘制一些汇总统计数据,例如 R 平方值.我似乎只能在命令行中获得 R Squared 值.任何建议;我需要查看 ggplot 或其他任何东西吗?提前致谢. #是否情节情节(df $ VAR1,df $ VAR2)#添加行abline(lm(df$VAR2~df$VAR1), col ..
发布时间:2022-01-07 23:33:15 其他开发