statistics相关内容

如何计算python中列表的方差?

如果我有这样的列表: results=[-14.82381293, -0.29423447, -13.56067979, -1.6288903, -0.31632439,0.53459687, -1.34069996, -1.61042692, -4.03220519, -0.24332097] 我想在 Python 中计算此列表的方差,即均值的平方差的平均值. 我该怎么办?访问列表中的 ..
发布时间:2022-01-07 23:19:12 Python

推荐一个开源的.NET统计库

我需要计算一堆数值数据的平均值、标准差、中位数等.有我可以使用的好的开源 .NET 库吗?我找到了 NMath,但它不是免费的,可能对我的需求来说太过分了. 解决方案 我在 CodeProject 网站上找到了这个.它看起来是一个很好的 C# 类,可以处理大多数基本的统计函数. http://www.codeproject.com/KB/cs/csstatistics.aspx ..
发布时间:2022-01-07 23:18:50 C#/.NET

用于异常检测的具有缺失值的时间序列的 STL 分解

我正在尝试检测气候数据时间序列中的异常值,但缺少一些观察结果.在网上搜索我发现了许多可用的方法.其中,stl 分解在去除趋势和季节性成分并研究其余部分的意义上似乎很有吸引力.阅读 STL:基于黄土的季节性趋势分解过程,stl 在确定分配可变性的设置,不受异常值的影响,尽管缺失值也可以应用.但是,尝试将其应用到 R 中,经过四年的观察并根据 http://stat.ethz.ch/R-manual/ ..
发布时间:2022-01-07 23:18:09 其他开发

如何将 RMSE、斜率、截距、r^2 添加到 R 图中?

如何使用 R 将 RMSE、斜率、截距和 r^2 添加到绘图中?我附上了一个带有示例数据的脚本,它与我的真实数据集格式相似——不幸的是,我处于停滞状态.是否有比从方程创建对象并将其插入 text() 更简单的方法将这些统计信息添加到图形中?理想情况下,我希望将统计信息堆叠在图表上.我怎样才能做到这一点? ## 生成样本数据x = c(2,4,6,8,9,4,5,7,8,9,10)y = c(4, ..
发布时间:2022-01-07 23:17:42 其他开发

如何获取 GitHub Clone 统计信息?

GitHub 的“Stats & Graphs"选项卡中曾经有一个“Clones"子选项卡(例如 https://github.com/TeamMentor/TeamMentor-Documentation/graphs/impact) 但那已经过去了. 还有其他方法可以获取这些统计信息吗? 如果我们能够让 Gauges 显示 Git 克隆、推送、拉取、GitHub 页面视图等,那就太 ..
发布时间:2022-01-07 23:17:29 其他开发

来自 C++ 中多元正态/高斯分布的样本

我一直在寻找一种从多元正态分布中采样的便捷方法.有谁知道一个现成的代码片段来做到这一点?对于矩阵/向量,我更喜欢使用 Boost 或 Eigen 或其他我不熟悉的非凡库,但是我可以在紧要关头使用 GSL.如果该方法接受非负-定协方差矩阵而不是要求正定(例如,与 Cholesky 分解一样),我也喜欢它.这存在于 MATLAB、NumPy 和其他软件中,但我很难找到现成的 C/C++ 解决方案. ..

如何计算 R 中线性回归模型中斜率的 95% 置信区间

这是一个来自 R 的介绍性统计练习: 使用 rmr 数据集,绘制代谢率与体重的关系图.将线性回归模型拟合到该关系.根据拟合模型,70 公斤体重的预测代谢率是多少?给出直线斜率的 95% 置信区间. rmr 数据集位于“ISwR"包中.它看起来像这样: >资源管理器体重代谢率1 49.9 10792 50.8 11463 51.8 11154 52.6 11615 57.6 13256 ..
发布时间:2022-01-07 23:16:13 其他开发

哪些 Git 提交统计数据很容易提取

以前我很喜欢 TortoiseSvn 为给定的 SVN 存储库生成简单提交统计信息的能力.我想知道 Git 中有哪些可用的东西,而且我特别感兴趣: 每个用户的提交次数 每个用户更改的行数 一段时间内的活动(例如每周汇总的变化) 有什么想法吗? 解决方案 其实 git 已经有这个命令了: git shortlog 就您而言,您似乎对这种形式感兴趣: git shortl ..
发布时间:2022-01-07 23:16:00 其他开发

R 随机森林变量重要性

我正在尝试使用随机森林包在 R 中进行分类. 列出的变量重要性度量是: 0 类变量 x 的平均原始重要性得分 第 1 类变量 x 的平均原始重要性得分 MeanDecreaseAccuracy MeanDecreaseGini 现在我知道这些“意思"是什么,因为我知道它们的定义.我想知道的是如何使用它们. 我真正想知道的是,这些值仅在它们的准确度、什么是好的值、什么是 ..
发布时间:2022-01-07 23:15:32 AI人工智能

Product() 聚合函数

在解释 CTE 的一些概念时,被问到一个可爱的问题..我们能找到行的乘法吗,而我们总是专注于新人的 SUM().这让我想到了!是否可以仅使用 SQL.我也在考虑我们甚至可以支持的最大数字精度,因为产品可能非常庞大. 话虽如此,我们不能编写自己的聚合函数.(我们可以吗?)我在想仅使用 SQL 是否可行. 我认为 2*3 就像将 2 、 3 次添加到自身.. 但是当集合很大.. 我不能让它 ..
发布时间:2022-01-07 23:14:52 数据库

对数据集中每一行的列进行 t.test

我有一组数据 x,它由 12 列和 167 行组成.第一列是每行的化合物 Id.我想为 3 列运行 t.test 作为一组,其他 3 组作为第二组,分别为每行运行.我的代码如下,但它不起作用. for (i in 1:nrow(x)) {功能(i)c(化合物= i,t.test(x[2:4],x[8:10],x[x$化合物==i, ],替代='双侧',conf.level=0.95))}打印(c ..
发布时间:2022-01-07 23:13:58 其他开发

给定轮班列表,创建时间表的摘要描述

假设我有一个事件的轮班列表(格式为开始日期/时间、结束日期/时间) - 是否有某种算法可以用来创建日程的概括摘要?大多数轮班陷入某种常见的重复模式(即星期一上午 9:00 到下午 1:00,星期二上午 10:00 到下午 3:00 等)是很常见的.但是,此规则可以(并且将会)有例外(例如,其中一个班次在假期发生并被重新安排在第二天).最好从我的“摘要"中排除那些,因为我希望提供一个更一般的答案,说 ..
发布时间:2022-01-07 23:13:49 C#/.NET

如何确保分区具有来自因子每个级别的代表性观察?

我编写了一个小函数来将我的数据集划分为训练集和测试集.但是,我在处理因子变量时遇到了麻烦.在我的代码的模型验证阶段,如果模型建立在没有来自每个因子级别的表示的数据集上,我会收到错误消息.如何修复此 partition() 函数以包含来自因子变量每个级别的至少一个观察结果? test.df EDIT - 使用“caret"包和 createDataPartition() 的新函数: part ..
发布时间:2022-01-07 23:13:39 其他开发

如何在 ggplot2 中使用填充美学绘制两组的相对比例?

如何在 ggplot2 中使用填充美学绘制两组的相对比例? 我在这里问这个问题是因为关于这个主题的其他几个答案似乎不正确(ex1, ex2 和ex3),但 Cross Validated 似乎在功能上禁止了 R 特定问题(简历元)...density.. 在概念上与比例相关,但与比例不同 (ex4 和 ex5).所以正确答案似乎不涉及密度. 示例: set.seed(1200)测试 ..
发布时间:2022-01-07 23:13:31 其他开发

使用 Matplotlib 在 3d 中绘制线性模型

我正在尝试创建适合数据集的线性模型的 3d 图.我能够在 R 中相对容易地做到这一点,但我真的很难在 Python 中做到这一点.这是我在 R 中所做的: 这是我在 Python 中所做的: from mpl_toolkits.mplot3d 导入 Axes3D导入 matplotlib.pyplot 作为 plt将 numpy 导入为 np将熊猫导入为 pd将 statsmodels.f ..
发布时间:2022-01-07 23:13:12 Python

Excel 中的 RAND() 函数用于蒙特卡罗模拟有多好?

我正在 Excel 中以 3 个变量实现蒙特卡罗模拟.我已经使用 RAND() 函数从 Weibull 分布(长尾)中进行采样.应用于样本的函数是非线性但平滑的(exp、ln、cos 等).每个样本的结果是通过/失败,总体结果是失败的概率. 我还在 MathCad 中通过数值积分和蒙特卡罗实现了这一点,两次都得到了相同的结果.MathCad 使用(我认为)Mersenne Twister 随 ..
发布时间:2022-01-07 23:12:53 其他开发

如何在 ggplot2 中绘制 logit 和 probit

这几乎肯定是一个新手问题/ 对于下面的数据集,我一直试图在 ggplot2 中绘制 logit 和 probit 曲线,但没有成功. Ft Temp TD1 66 06 72 011 70 116 75 021 75 12 70 17 73 012 78 017 70 022 76 03 69 08 70 013 67 018 81 023 58 14 68 09 57 114 53 11 ..
发布时间:2022-01-07 23:12:31 其他开发