probability-density相关内容

R中的Sample()函数

我的问题很简单,我正在尝试使用sample()模拟来自任何分布的500个抽奖。 以二项分布B(10,0.5)为例。使用R.中的sample()函数 我是这样做的: draw = 1:500 data = sample(x=draw, size=10, replace=TRUE, prob=rep(0.5, each=500)) 然而,每当我绘制历史图时,它看起来像是随机的,而 ..
发布时间:2022-07-12 15:28:11 其他开发

给定来自 Python 分布的样本列表,如何计算值的概率?

不确定这是否属于统计数据,但我正在尝试使用 Python 来实现这一点.我基本上只有一个整数列表: data = [300,244,543,1011,300,125,300 ... ] 我想知道给定这些数据的值出现的概率.我使用 matplotlib 绘制了数据的直方图并获得了这些: 在第一个图中,数字表示序列中的字符数.在第二张图中,它是以毫秒为单位测量的时间量.最小值大于零,但不一定 ..
发布时间:2021-12-31 12:21:36 Python

如何从 Scipy 的 wasserstein_distance 中提取距离和传输矩阵?

scipy.stats.wasserstein_distance 函数只返回两个输入分布之间的最小距离(解),p 和 q.但该距离是距离矩阵和必须在同一函数内计算的最佳传输矩阵的乘积的结果. 如何提取与解决方案对应的距离矩阵和最优传输矩阵作为第二和第三个输出参数? 解决方案 似乎无法从 scipy 的 wasserstein_distance 中获得计算出的传输矩阵.不过,您可以通过 ..
发布时间:2021-08-30 18:49:37 Python

使用 python 的多元学生 t 分布

要生成具有多元 t 分布的样本,我使用此函数: def multivariatet(mu,Sigma,N,M):'''输出:生成 d 维多元 t 分布的 M 个样本输入:mu = 均值(d 维 numpy 数组或标量)Sigma = 比例矩阵(dxd numpy 数组)N = 自由度M = 要生产的样本数量'''d = len(Sigma)g = np.tile(np.random.gamma( ..
发布时间:2021-07-16 20:33:56 Python

R中二维核密度估计的混淆

核密度估计器用于估计特定的概率密度函数(参见 mvstat.net 和 sckit-learn 文档参考) 我的困惑在于 kde2d() 到底做了什么?在下面的例子中,它是否估计了两个随机变量 f(a,b) 的联合分布概率密度函数?颜色是什么意思? 这是我所指的代码示例. b 解决方案 什么是核密度估计器?本质上,它在数据的每个点(正态密度的中心是那个点)上拟合了一条小的正态密 ..

从数据分位数中随机抽样,同时保留原始概率分布

按照我之前的题为:“随机抽样从数据集中,同时保留原始概率分布",我想从测量收集的 >2000 个数字中进行采样.我想执行几个测试(我在每个测试中最多取 10 个样本),同时在整个测试过程和每个测试中(尽可能多地)保留概率分布.现在,我不是完全随机抽样,而是将数据划分为 5 个分位数,在 10 次测试中,我从每个分位数中抽取 2 个数据元素,对每个分位数中的数据数组使用均匀随机分布. 完全随机 ..
发布时间:2021-07-14 20:02:12 Java开发

Python 如何使用 n、min、max、mean、std、25%、50%、75%、Skew、Kurtosis 来定义伪随机概率密度估计/函数?

在阅读和试验 numpy.random 时,我似乎无法找到或创建我需要的东西;一个包含 10 个参数的 Python 伪随机值生成器,包括计数、最小值、最大值、平均值、sd、25th%ile、50th%ile(中值)、75th%ile、skew 和 kurtosis. 来自 https://docs.python.org/3/library/random.html 我看到这些分布是均匀分布、 ..
发布时间:2021-07-02 20:00:09 其他开发

从具有可变底层网格的内核密度估计器进行模拟

我有一个数据集,用于通过估计核密度来创建经验概率分布.现在我正在使用 R 的 kde2d 来自 MASS 包.估计概率分布后,我使用 sample 沿 x 轴从二维分布的切片中采样.我使用 sample 很像此处所述.示例代码看起来像这样 库(MASS)set.seed(123)x = 范数(100, 1, 0.1)set.seed(456)y = 范数(100, 1, 0.5)den ..
发布时间:2021-07-02 19:55:23 其他开发

如何使用逆 CDF 在 Python 中随机采样对数正态数据并指定目标百分位数?

我正在尝试从 Python 中的对数正态分布生成随机样本,该应用程序用于模拟网络流量.我想生成这样的样本: 模态样本结果为 320 (~10^2.5) 80% 的样本位于 100 到 1000(10^2 到 10^3)范围内 我的策略是使用逆 CDF(或我相信的 Smirnov 变换): 使用以 2.5 为中心的正态分布的 PDF 计算 10^x 的 PDF,其中 x ~ N( ..
发布时间:2021-07-02 19:51:37 Python

Python中给定PDF的随机数

我想生成一个整数随机数,其概率分布函数以列表形式给出.例如,如果 pdf=[3,2,1] 那么我喜欢rndWDist(pdf)返回 0,1 和 2,概率为 3/6、2/6 和 1/6.我为此编写了自己的函数,因为我在 random 模块中找不到它. def randintWDist(pdf):cdf=[]对于 pdf 中的 x:如果 CDF:cdf.append(cdf[-1]+x)别的:cdf ..
发布时间:2021-07-02 19:50:58 Python

将数据点拟合到累积分布

我正在尝试将伽马分布拟合到我的数据点,我可以使用下面的代码来做到这一点. 将 scipy.stats 导入为 ss将 numpy 导入为 np数据点 = np.arange(0,1000,0.2)fit_alpha,fit_loc,fit_beta = ss.rv_continuous.fit(ss.gamma, dataPoints, floc=0) 我想使用许多这样小的伽马分布来重建更大的 ..
发布时间:2021-06-10 19:39:31 Python

为抽样创建混合概率分布

是否有一种通用的方法可以连接 SciPy(或 NumPy)概率分布以创建混合概率分布,然后可以从中采样? 我有一个这样的发行版,使用类似的东西来显示: mixture_gaussian = (norm.pdf(x_axis, -3, 1) + norm.pdf(x_axis, 3, 1))/2 如果然后绘制看起来像: 但是,我无法从这个生成的模型中采样,因为它只是一个将绘制为曲线的 ..
发布时间:2021-06-10 19:30:46 Python

如何通过R ggplot中的多个条件/方面来计算和标记分布的峰值?

虽然这个问题看起来与其他问题相似,但我的想法却有一个关键的区别. 我希望能够计算和/或打印(将其绘制为最终目标,但在数据框架中将其作为主要目标进行计算)EACH SUB密度曲线的 峰值-CONFITION BY FACET 密度图如下所示: 因此,理想情况下,我将能够知道每种条件下对应于密度曲线最高峰的强度(x轴值). 这里有一些虚拟数据: set.seed(1234)图书馆 ..
发布时间:2021-05-10 20:04:28 其他开发

在R中绘制beta分布

使用数据集 Lahman :: Batting 我已经估计了 beta分布的参数.现在,我要将此经验导出的beta分布绘制到我据此估计的直方图中. 库(dplyr)图书馆(tidyr)图书馆(拉曼)职业 0)%>%anti_join(投球,by ="playerID")%&%group_by(playerID)%&%;%总结(H = sum(H),AB = su ..