statistics相关内容
我有一个大小为 的 numpy 数组 arr.size = (200, 600, 20). 我想在最后两个维度的每个成对组合上计算 scipy.stats.kendalltau.例如: kendalltau(arr[:, 0, 0], arr[:, 1, 0])kendalltau(arr[:, 0, 0], arr[:, 1, 1])kendalltau(arr[:, 0, 0], ar
..
是否有开源来计算 C、C++ 或 Fortran 中高斯分布的多变量(其中维度大于 3,而不是二元或三元)数值 cdf? 我相信 IMSL 做到了;http://www.roguewave.com/portals/0/products/imsl-numerical-libraries/c-library/docs/7.0/html/cstat/default.htm?turl=multiva
..
..
有谁知道是否可以使用 ggvis 交互地更改 x 和 y 轴的变量?我可以更改数据点的大小、它们的位置和不透明度,但我无法确定是否可以允许用户从下拉列表中选择一个变量,该变量将成为 x/y 轴的数据. 解决方案 ggvis 包旨在与 dplyr 结合使用,例如来总结数据.dplyr 包还重新导出了 magrittr 管道运算符(%>%,请参阅 README.md),这使得使用 ggvis' 实
..
我在 Excel 电子表格中有一个很大的数据表,从本质上讲,它可以被认为是被识别为属于不同亚群的个人的值的集合: IndivID SubPopID 值1 A 33.562 东 42.313D 16.354 50.595 华氏度 80.63... 此表中有 10,000 多个个体,以及 50 多个亚群. 我想计算每个亚群的 5 数汇总(最小值、Q1、中值、Q3、最大值). Min
..
在绘制数据的正态分布图时,我们如何使用 matplotlib/seaborn 或 plotly 为每个条带宽度为 1 标准差的每个 bin 中的数据百分比放置如下图所示的标签? 目前,我是这样绘制的: hmean = np.mean(data)hstd = np.std(数据)pdf = stats.norm.pdf(数据,hmean,hstd)plt.plot(数据,pdf) 解决方案
..
我想为 scipy.stats.powerlaw 例程提供负指数,例如a=-1.5,为了抽取随机样本: """powerlaw.pdf(x, a) = a * x**(a-1)"""从 scipy.stats 导入幂律R = powerlaw.rvs(a, size=100) 为什么需要 > 0,我如何提供负 a 以生成随机样本,以及如何提供归一化系数/变换,即 PDF(x,C,a) = C
..
有没有办法在 Python 中找到 r 置信区间? 在 R 中,我可以执行以下操作: cor.test(m, h)Pearson 的乘积-矩相关性数据:m 和 ht = 0.8974,df = 4,p 值 = 0.4202备择假设:真正的相关性不等于 095% 置信区间:-0.6022868 0.9164582样本估计:科尔0.4093729 在 Python 中,我可以使用以下方法计算
..
在 Java 中,我通常依赖于 org.apache.commons.math3.random.EmpiricalDistribution 类执行以下操作: 从观察到的数据中推导出概率分布. 从此分布生成随机值. 是否有提供相同功能的 Python 库?看起来像 scipy.stats.gaussian_kde.resample 做了类似的事情,但我不确定它是否实现了与我熟悉的 Ja
..
我需要一个 MAPE 函数,但是我无法在标准包中找到它......下面是我对这个函数的实现. def mape(actual, predict):tmp, n = 0.0, 0对于范围内的 i (0, len(actual)):如果实际[i] 0:tmp += math.fabs(actual[i]-predict[i])/actual[i]n += 1回报 (tmp/n) 我不喜欢它,它
..
我遵循了在另一篇文章中定义自相关函数的建议: def autocorr(x):结果 = np.correlate(x, x, mode = 'full')maxcorr = np.argmax(result)#print 'maximum = ', 结果[maxcorr]结果 = 结果/结果 [maxcorr] #
..
我在 python 中使用 matplotlib 对数据集应用了 pca.但是,matplotlib 不像 Matlab 那样提供 t 平方分数.有没有办法像 Matlab 一样计算 Hotelling 的 T^2 分数? 谢谢. 解决方案 matplotlib 的 PCA 类不包括 Hotelling T2 计算,但只需几行代码即可完成.以下代码包含一个函数,用于计算每个点的 T2
..
我有一组浮点值(总是小于 0).我想将其放入直方图中,IE.直方图中的每个条形都包含值范围 [0,0.150) 我拥有的数据如下所示: 0.0000.0050.1240.0000.0040.0000.1110.112 在我下面的代码中,我希望得到看起来像这样的结果 [0, 0.005) 5[0.005, 0.011) 0...等等.. 我试图用我的这段代码做这样的分箱.但它似乎不起作
..
我有一个带有 m 行和 n 列的矩阵 data.我曾经使用 np.corrcoef: 将 numpy 导入为 np数据 = np.array([[0, 1, -1], [0, -1, 1]])np.corrcoef(数据) 现在我还想看看这些系数的 p 值.np.corrcoef 不提供这些;scipy.stats.pearsonr 确实如此.但是,scipy.stats.pearsonr 不
..
我知道现在有很多关于它的问题,即使是同样的问题,但我想我尝试了一些不同的方法. 任务是对 10.000 个样本进行 100 次翻转,然后计算所有样本出现 6 次正面或反面连续的概率 - 据我所知.但在之前的问题中,编码问题被描述为有点模糊.因此,如果你们能指出代码中的错误,那就太好了:) 我尽量保持懒惰,这导致我的 macbook 非常努力地工作.这是我的代码.我对当前值与之前值比较的
..
Numerical Recipes 一书提供了一种计算 64 位哈希码以减少冲突次数的方法. 该算法显示在 http://www.javamex.com/tutorials/collections/strong_hash_code_implementation_2.shtml 复制到这里供参考: private static final createLookupTable() {byteT
..
我正在寻找通过 t, t-1 等随时间t 的单个测量计算(自动)协方差矩阵的效率增益.> 在数据矩阵中,每一行代表一个人,每一列代表每月的测量值(列按时间顺序排列).类似于以下数据(尽管有更多的协方差). #模拟数据set.seed(1)周期 下面是我想出的(丑陋的)代码来获得测量/滞后测量的协方差矩阵.运行大约需要 4 秒.我确信通过移动到 data.table,多思考而不依赖循环,我可以
..
我想知道有没有什么简单的方法可以使用 python 但不使用 python 包来做几何平均.如果没有,有没有简单的包来做几何平均? 解决方案 几何均值的公式为: 因此您可以轻松编写如下算法: 将 numpy 导入为 npdef geo_mean(可迭代):a = np.array(iterable)返回 a.prod()**(1.0/len(a)) 您不必为此使用 numpy,但
..
我们在 Google Play 上有一个 Androïd 应用,我想以编程方式检索销售报告.Apple 提供了 Autoingestion 工具,它允许 Java 应用程序检索它们,甚至还有一个 Ruby 端口:https://github.com/siuying/itunes-auto-ingestion 有人知道 Androïd 或至少 API 是否有类似的东西吗?我找不到. 非常
..
这似乎是一个简单的问题,所以我希望它是一个简单的答案.我正在绘制我的点并拟合线性模型,我可以做到.然后,我还想在图上绘制一些汇总统计数据,例如 R 平方值.我似乎只能在命令行中获得 R Squared 值.任何建议;我需要查看 ggplot 或其他任何东西吗?提前致谢. #是否情节情节(df $ VAR1,df $ VAR2)#添加行abline(lm(df$VAR2~df$VAR1), col
..