statistics相关内容

计算大数字的方差

我还没有真正使用过那么多的方差计算,我也不知道会发生什么.其实我数学一点都不好. 我有一个由 0-10000 范围内的 1000000 个随机数值组成的数组. 数组可以变得更大,所以我使用 64 位 int 来求和. 我试图找到关于如何计算方差的代码,但我不知道我是否得到了正确的输出. 平均值为 4692,中位数为 4533.我使用以下代码得到方差 1483780.4693 ..
发布时间:2022-01-07 23:56:22 C/C++开发

如何使用 rpy2 在 Jupyter notebook 中应用 Henze-Zirkler 的多元正态性检验

我对在 python 3x 中应用 Henze-Zirkler 的多元正态性检验感兴趣,我想知道我是否可以在 Jupyter notebook 中的 python 中这样做. 我已经用我的数据拟合了一个 VAR 模型,然后我想测试这个拟合 VAR 模型的残差是否是正态分布的. 如何在 Jupyter Notebook 中使用 python 执行此操作? 解决方案 这是另一个答案 ..

哪些统计数据表明 Z3 有效运行?

SMTLib2 指令 (get-info all-statistics) 显示多个数字,例如 编号.冲突:4数量传播:0(二进制:0)数量质量.安装:23 为了测试不同的公理化和编码,我想知道哪些数字适合声明一个 Z3 运行比另一个更好/更有效. 从名字猜测我会说num.质量.inst - 量词实例化的数量 - 是一个很好的指标(越低 = 越好),但其他的呢? 解决方案 量词实例 ..
发布时间:2022-01-07 23:55:34 其他开发

MS Excel LINEST、TREND、LOGEST 和 GROWTH 函数中的缺失值

我在 Excel 2003 中使用 GROWTH(或 LINEST 或 TREND 或 LOGEST,都犯同样的问题)函数.但有一个问题,如果缺少某些数据,该函数拒绝给出结果: 您可以在此处下载文件. 有什么解决方法吗?寻找简单优雅的解决方案. 我不想要摆脱缺失值的明显解决方法 - 这意味着删除列并且这也会损坏图表,并且它会在我有更多的其他表中产生问题行和不同列中的缺失数据.其他 ..
发布时间:2022-01-07 23:55:19 其他开发

如何获取 PC 的主板温度(以及其他硬件统计数据)?

有谁知道如何获取当前主板、处理器或硬盘的温度统计数据吗? 在 GNU/Linux 中,我知道我可以使用 hddtemp 或 sensord 之类的东西来获取信息,然后解析它……但在 Windows 中:我该怎么做?并且,可以使用 C# 或 Java 或任何其他高级编程语言来完成吗? 谢谢! 解决方案 温度和其他监控传感器的问题在于硬件级别没有通用协议,也没有驱动程序允许使用通用 API ..
发布时间:2022-01-07 23:54:56 Java开发

ORDER BY RAND() 似乎小于随机

我有一个相当简单的 SQL (MySQL): SELECT foo FROM bar ORDER BY rank, RAND() 我注意到当我刷新结果时,随机性很弱. 在此时的样本数据中,有 6 个具有相同秩的结果(整数零).有很多随机性测试,但这里有一个简单的手工测试:当运行两次时,两次运行的第一个结果应该是相同的,大约六分之一的时间.这当然不会发生,领先的结果至少有三分之一是相同的. ..
发布时间:2022-01-07 23:54:43 数据库

程序统计工具

是否有工具可以解析我的源代码(fortran、C 或 C++)并返回统计信息,例如循环次数、平均循环大小、函数数量、函数调用次数、次数, 数组、变量等的大小和类型? 类似于 this 的东西,它在我的架构上不容易运行 解决方案 Google 的神奇术语是“代码度量".维基百科有一个列表. ..
发布时间:2022-01-07 23:54:35 C/C++开发

操作数据以更好地拟合高斯分布

我有一个关于正态分布的问题(mu = 0 和 sigma = 1). 假设我首先以这种方式调用 randn 或 normrnd x = normrnd(0,1,[4096,1]);% x = randn(4096,1) 现在,为了评估 x 值与正态分布的拟合程度,我调用 [a,b] = normfit(x); 并有图形支持 histfit(x) 现在来到问题的核心:如果我对 x ..
发布时间:2022-01-07 23:54:29 其他开发

ggplot2:绘制具有不同截距但具有相同斜率的回归线

我想绘制具有不同截距但具有相同斜率的回归线. 使用以下 ggplot2 代码,我可以绘制具有不同截距和不同斜率的回归线.但是不知道如何绘制不同截距但相同斜率的回归线. 库(ggplot2)ggplot(data=df3, mapping=aes(x=Income, y=Consumption, color=Gender)) + geom_point() +geom_smooth(数据=df ..
发布时间:2022-01-07 23:54:10 其他开发

Pandas corr() 经常返回 NaN

我试图在数据帧上运行我认为应该是一个简单的相关函数,但它在我认为不应该的地方返回 NaN. 代码: # 设置将熊猫导入为 pd导入 iocsv = io.StringIO(u'''身份证日期编号2018-08-01 992018-08-02 502018-08-03 1002018-08-04 1002018-08-05 100乙 2018-07-31 500乙 2018-08-01 10 ..
发布时间:2022-01-07 23:53:50 Python

如何在 MATLAB 中计算 99% 的覆盖率?

我在 MATLAB 中有一个矩阵,我需要为每一列找到 99% 的值.换句话说,该值使得 99% 的人口具有比它更大的值.MATLAB 中是否有用于此的函数? 解决方案 使用 QUANTILE 函数. Y = 分位数(X,P); 其中 X 是矩阵,P 是标量或概率向量.例如,如果 P=0.01,Y 将是每列值的向量,因此 99% 的列值更大. ..
发布时间:2022-01-07 23:53:41 其他开发

在 Android 上使用 Canvas 在两条线之间绘制区域

我正在为我的应用程序开发一个简单的统计图形类.我已经尝试过 aChartEngine 和其他更多的东西,但我更喜欢使用我自己的类.我正在使用包含 Android 的 Canvas 类绘制图形,但问题是我不知道如何填充线条和底部边框之间的区域.现在,矩形没有填满所有区域,很明显,你知道有什么解决办法吗?非常感谢. 解决方案 使用 Path,带有 Paint 具有 .setStyle(Pain ..
发布时间:2022-01-07 23:53:32 移动开发

找到 minma/valley 点并获取 R 中谷开始和谷结束的索引

我是统计和 R 的新手.我需要找到峰值和谷值以及峰值/谷值开始和结束的索引. 对于最大值/峰值,我得到了 findPeaks 函数,它可以帮助我满足峰值要求.但我找不到任何包来查找适合我要求的谷点. 下面是寻找峰值的R函数. function (x, nups = 1, ndowns = nups, zero = "0", peakpat = NULL,minpeakheight ..
发布时间:2022-01-07 23:53:08 AI人工智能

获得两组分数的平均值的绝对偏差

为了获得两组分数的平均值的绝对偏差,我通常需要在 R 中编写长代码,如下所示. 问题 我想知道是否有可能在 BASE R 中以某种方式 Vectorize mad() 函数,以便每组分数的平均分数的绝对偏差在我下面展示的示例中,可以使用 mad() 的 Vectorized 版本获得?任何其他可行的想法都受到高度赞赏? set.seed(0)y = as.vector(unlist( ..
发布时间:2022-01-07 23:52:34 其他开发

在 Java lambda 中使用两个流来计算协方差

假设我有两个双精度数组.我一直在试验 Java 8 中的 Stream.我想我已经理解了主要思想但后来我意识到我不确定如何同时操作两个流. 例如,我想计算两个数组的协方差. 公共类 foo {公共静态双均值(双[] xs){返回 Arrays.stream(xs).average().getAsDouble();}公共静态无效主(字符串 [] args){double[] xs = {1, ..
发布时间:2022-01-07 23:52:12 Java开发