statistics 第4页 - IT屋-程序员软件开发技术分享社区

计算大数字的方差

我还没有真正使用过那么多的方差计算，我也不知道会发生什么.其实我数学一点都不好. 我有一个由 0-10000 范围内的 1000000 个随机数值组成的数组. 数组可以变得更大，所以我使用 64 位 int 来求和. 我试图找到关于如何计算方差的代码，但我不知道我是否得到了正确的输出. 平均值为 4692，中位数为 4533.我使用以下代码得到方差 1483780.4693 ..

发布时间：2022-01-07 23:56:22 c++ math statistics largenumber variance C/C++开发

AttributeError: 'NoneType' 对象没有属性 'setCallSite'

在 PySpark 中，我想计算两个数据帧向量之间的相关性，使用以下代码(我在导入 pyspark 或 createDataFrame 时没有任何问题): from pyspark.ml.linalg import Vectors从 pyspark.ml.stat 导入相关性导入pysparkspark = pyspark.sql.SparkSession.builder.master("loc ..

发布时间：2022-01-07 23:56:13 python pyspark statistics apache-spark-sql correlation Python

如何使用 rpy2 在 Jupyter notebook 中应用 Henze-Zirkler 的多元正态性检验

我对在 python 3x 中应用 Henze-Zirkler 的多元正态性检验感兴趣，我想知道我是否可以在 Jupyter notebook 中的 python 中这样做. 我已经用我的数据拟合了一个 VAR 模型，然后我想测试这个拟合 VAR 模型的残差是否是正态分布的. 如何在 Jupyter Notebook 中使用 python 执行此操作? 解决方案这是另一个答案 ..

发布时间：2022-01-07 23:55:48 python-3.x statistics jupyter-notebook multivariate-testing 其他开发

如何生成表示离散均匀分布总和的数字

第 1 步: 假设我想生成取值为 -1 或 1 的离散均匀随机数.换句话说，我想生成具有以下分布的数字: P(X = -1) = 0.5P(X = 1) = 0.5 要生成一个由 100 个数字组成的数组，我可以编写以下代码: n = 100DV = [-1,1];% 离散值RI = unidrnd(2,n,1);% 随机均匀指数DUD = DV(RI);% 离散均匀分布我的 DU ..

发布时间：2022-01-07 23:55:42 matlab statistics sum uniform-distribution 其他开发

哪些统计数据表明 Z3 有效运行?

SMTLib2 指令 (get-info all-statistics) 显示多个数字，例如编号.冲突:4数量传播:0(二进制:0)数量质量.安装:23 为了测试不同的公理化和编码，我想知道哪些数字适合声明一个 Z3 运行比另一个更好/更有效. 从名字猜测我会说num.质量.inst - 量词实例化的数量 - 是一个很好的指标(越低 = 越好)，但其他的呢? 解决方案量词实例 ..

发布时间：2022-01-07 23:55:34 encoding statistics solver smt z3 其他开发

MS Excel LINEST、TREND、LOGEST 和 GROWTH 函数中的缺失值

我在 Excel 2003 中使用 GROWTH(或 LINEST 或 TREND 或 LOGEST，都犯同样的问题)函数.但有一个问题，如果缺少某些数据，该函数拒绝给出结果: 您可以在此处下载文件. 有什么解决方法吗?寻找简单优雅的解决方案. 我不想要摆脱缺失值的明显解决方法 - 这意味着删除列并且这也会损坏图表，并且它会在我有更多的其他表中产生问题行和不同列中的缺失数据.其他 ..

发布时间：2022-01-07 23:55:19 excel statistics excel-2003 regression 其他开发

如何获取 PC 的主板温度(以及其他硬件统计数据)?

有谁知道如何获取当前主板、处理器或硬盘的温度统计数据吗? 在 GNU/Linux 中，我知道我可以使用 hddtemp 或 sensord 之类的东西来获取信息，然后解析它……但在 Windows 中:我该怎么做?并且，可以使用 C# 或 Java 或任何其他高级编程语言来完成吗? 谢谢！解决方案温度和其他监控传感器的问题在于硬件级别没有通用协议，也没有驱动程序允许使用通用 API ..

发布时间：2022-01-07 23:54:56 java statistics hardware temperature Java开发

创建新索引时是否会自动更新统计信息?

在创建索引后运行 UPDATE Statistics 是否有任何好处，还是自动为您完成? 解决方案如果新索引需要新的统计信息，它们会自动创建，除非您通过 CREATE INDEX ... WITH 显式禁用新索引的统计信息计算STATISTICS_NORECOMPUTE = ON ..

发布时间：2022-01-07 23:54:50 sql-server indexing statistics 数据库

ORDER BY RAND() 似乎小于随机

我有一个相当简单的 SQL (MySQL): SELECT foo FROM bar ORDER BY rank, RAND() 我注意到当我刷新结果时，随机性很弱. 在此时的样本数据中，有 6 个具有相同秩的结果(整数零).有很多随机性测试，但这里有一个简单的手工测试:当运行两次时，两次运行的第一个结果应该是相同的，大约六分之一的时间.这当然不会发生，领先的结果至少有三分之一是相同的. ..

发布时间：2022-01-07 23:54:43 mysql sql random statistics 数据库

程序统计工具

是否有工具可以解析我的源代码(fortran、C 或 C++)并返回统计信息，例如循环次数、平均循环大小、函数数量、函数调用次数、次数, 数组、变量等的大小和类型? 类似于 this 的东西，它在我的架构上不容易运行解决方案 Google 的神奇术语是“代码度量".维基百科有一个列表. ..

发布时间：2022-01-07 23:54:35 c++ c statistics parsing fortran C/C++开发

操作数据以更好地拟合高斯分布

我有一个关于正态分布的问题(mu = 0 和 sigma = 1). 假设我首先以这种方式调用 randn 或 normrnd x = normrnd(0,1,[4096,1]);% x = randn(4096,1) 现在，为了评估 x 值与正态分布的拟合程度，我调用 [a,b] = normfit(x); 并有图形支持 histfit(x) 现在来到问题的核心:如果我对 x ..

发布时间：2022-01-07 23:54:29 matlab normal-distribution statistics 其他开发

ggplot2:绘制具有不同截距但具有相同斜率的回归线

我想绘制具有不同截距但具有相同斜率的回归线. 使用以下 ggplot2 代码，我可以绘制具有不同截距和不同斜率的回归线.但是不知道如何绘制不同截距但相同斜率的回归线. 库(ggplot2)ggplot(data=df3, mapping=aes(x=Income, y=Consumption, color=Gender)) + geom_point() +geom_smooth(数据=df ..

发布时间：2022-01-07 23:54:10 r ggplot2 statistics regression linear-regression 其他开发

Pandas corr() 经常返回 NaN

我试图在数据帧上运行我认为应该是一个简单的相关函数，但它在我认为不应该的地方返回 NaN. 代码: # 设置将熊猫导入为 pd导入 iocsv = io.StringIO(u'''身份证日期编号2018-08-01 992018-08-02 502018-08-03 1002018-08-04 1002018-08-05 100乙 2018-07-31 500乙 2018-08-01 10 ..

发布时间：2022-01-07 23:53:50 python pandas dataframe statistics correlation Python

如何在 MATLAB 中计算 99% 的覆盖率?

我在 MATLAB 中有一个矩阵，我需要为每一列找到 99% 的值.换句话说，该值使得 99% 的人口具有比它更大的值.MATLAB 中是否有用于此的函数? 解决方案使用 QUANTILE 函数. Y = 分位数(X,P); 其中 X 是矩阵，P 是标量或概率向量.例如，如果 P=0.01，Y 将是每列值的向量，因此 99% 的列值更大. ..

发布时间：2022-01-07 23:53:41 matlab matrix statistics percentile 其他开发

在 Android 上使用 Canvas 在两条线之间绘制区域

我正在为我的应用程序开发一个简单的统计图形类.我已经尝试过 aChartEngine 和其他更多的东西，但我更喜欢使用我自己的类.我正在使用包含 Android 的 Canvas 类绘制图形，但问题是我不知道如何填充线条和底部边框之间的区域.现在，矩形没有填满所有区域，很明显，你知道有什么解决办法吗?非常感谢. 解决方案使用 Path，带有 Paint 具有 .setStyle(Pain ..

发布时间：2022-01-07 23:53:32 android graphics canvas statistics 移动开发

在 R 中的各个列和给定数据帧的其余部分之间的 t 检验

这是在 R 中.我需要帮助获取基本格式的数据框 NAC cOF3 APir Pu Tu V2.3 mOF3 DGpf1 6.314770 6.181188 6.708971 6.052134 6.546938 6.079848 6.640716 6.2637702 8.825595 8.740217 9.532026 8.919598 8.776969 8.843287 8.631505 9. ..

发布时间：2022-01-07 23:53:17 r statistics dataframe 其他开发

找到 minma/valley 点并获取 R 中谷开始和谷结束的索引

我是统计和 R 的新手.我需要找到峰值和谷值以及峰值/谷值开始和结束的索引. 对于最大值/峰值，我得到了 findPeaks 函数，它可以帮助我满足峰值要求.但我找不到任何包来查找适合我要求的谷点. 下面是寻找峰值的R函数. function (x, nups = 1, ndowns = nups, zero = "0", peakpat = NULL,minpeakheight ..

发布时间：2022-01-07 23:53:08 r machine-learning statistics AI人工智能

如何计算不同跨度内不同行的百分比变化

我正在尝试计算由 gvkey(1001、1384 等...)识别的公司的季度数据的价格变化百分比.它是相应的季度股票价格，PRCCQ. gvkey PRCCQ1 1004 23.7502 1004 13.8753 1004 11.2504 1004 10.3755 1004 13.6006 1004 14.0007 1004 17.0608 1004 8.1509 1004 7.40010 1 ..

发布时间：2022-01-07 23:52:44 r statistics plyr quantmod 其他开发

获得两组分数的平均值的绝对偏差

为了获得两组分数的平均值的绝对偏差，我通常需要在 R 中编写长代码，如下所示. 问题我想知道是否有可能在 BASE R 中以某种方式 Vectorize mad() 函数，以便每组分数的平均分数的绝对偏差在我下面展示的示例中，可以使用 mad() 的 Vectorized 版本获得?任何其他可行的想法都受到高度赞赏? set.seed(0)y = as.vector(unlist( ..

发布时间：2022-01-07 23:52:34 r function statistics 其他开发

在 Java lambda 中使用两个流来计算协方差

假设我有两个双精度数组.我一直在试验 Java 8 中的 Stream.我想我已经理解了主要思想但后来我意识到我不确定如何同时操作两个流. 例如，我想计算两个数组的协方差. 公共类 foo {公共静态双均值(双[] xs){返回 Arrays.stream(xs).average().getAsDouble();}公共静态无效主(字符串 [] args){double[] xs = {1, ..

发布时间：2022-01-07 23:52:12 java lambda statistics java-8 java-stream Java开发

statistics相关内容