statistics相关内容
我正在尝试生成相关矩阵的表格输出.具体来说,我使用 for 循环来确定第 4:40 列到第 1 列中所有数据之间的相关性.虽然该表的结果不错,但它不能确定正在比较的内容到什么.在检查 cor.test 的属性时,我发现 data.name 被指定为 x[1] 和 y[1] 这是不足以追溯哪些列正在与哪些列进行比较.这是我的代码: input
..
我想并排制作 2x2 条形图的代码,以便 y 轴最大值在所有和 常用标签 常见的xlabel 常见的传说 通用标题 每个条形图都有自己的副标题 每个条形图之间的分隔线,如图 2 所示 代码 # 想要输出 2x2 条形图,其中顶部列 Ite.1 和伊特.2 和行名称女性和男性# http://www.magesblog.com/2012/12/changed-colours-
..
我正在尝试使用 dplyr 中的汇总函数来计算汇总统计数据,该函数使用两个参数函数从连接的数据库中传递表和字段名称.不幸的是,一旦我用另一个函数包装汇总函数,结果就不正确.结束表是一个不遍历每一行的数据帧.我将在下面显示输入/输出: 汇总统计函数图书馆(dplyr) data%总结(计数 = n(),min = min(table[[field]], na.rm = T),mean = m
..
我可以在 MATLAB 中做哪些测试来测试直方图的传播?例如,在给定的一组直方图中,我只对 1、2、3、5 和 7(从左到右,从上到下)感兴趣,因为它们的分布较少.如何获得一个值来告诉我直方图是否正偏斜? 可能可以使用卡方检验,但我不确定 MATLAB 代码是什么. 解决方案 您可以使用标准偏度的定义.换句话说,您可以使用: 您计算数据的平均值,然后使用上述等式计算偏度.正偏度
..
我有以下列表: [[1, 1, 1, 1, 3, 0, 0, 1],[1, 1, 1, 1, 3, 0, 0, 1],[1, 1, 1, 1, 2, 0, 0, 1],[1, 1, 0, 2, 3, 1, 0, 1]] 在我想计算 inter-rater 可靠性分数的地方,有多个评分者(行).我不能使用 Fleiss 的 kappa,因为行的总和不是相同的数字.在这种情况下,什么是好的方法?
..
我有两个系列,系列 1 和系列 2.我的目标是自动/定量地找出Series2 与Series1 有多少不同,在bin 到bin 的基础上(每个bin 代表一个特定的特征). 可以通过 点击此处. Series1 是预期的结果.系列 2 是测试/传入系列. 我提供了一个直方图,其中 Series2 以深棕色表示.您还可以注意到 x 轴在 221 和 353 之间存在显着差异.即 Seri
..
我一直无法从 topicmodels 的 LDA 函数中创建可重现的结果.以他们的文档为例: 库(主题模型)设置种子(0)lda1 如何从对 LDA 的两次单独调用中获得相同的结果? 顺便说一句(以防软件包作者在这里),我发现 control=list(seed=0) 片段很不幸且不必要.在幕后,有一行表示 if (missing(seed)) seed .这不会使过程更可靠地随机,它
..
两个不同测量会话的两个数据文件:ECG 和 B ECG.每个数据文件包含男性和女性.我想在 R 中最低限度地做 2 列 x 4 行 Lattice Barchart,其中以下是界面的草图.我可以做 2x2 条形图,请参阅下面的代码.肯定有一些比手动添加越来越多的行到代码末尾更简单的方法,这很难控制. ECG B.ECG女 女窦到达/AHB地高辛呋塞米心电图 B.ECG男 男窦到达/AHB地高辛
..
我必须使用这样的 .csv 文件: "IDEA ID,""IDEA TITLE"",""VOTE VALUE""""56144,""净现值加 (NPV+)"",1""56144,""净现值加 (NPV+)"",1" 如果我使用 read.csv,我会获得一个带有一个变量的数据框.我需要的是一个包含三列的数据框,其中的列用逗号分隔.如何处理行首和行尾的引号? 解决方案 我建议删除初始/终
..
是否有可用的不同.Net 语言的流行度细分?有没有人知道提供这些信息的任何调查,或者是否有可能确定这一点? 更新 答案是不是不同 .Net 语言的列表.我希望看到显示每种 .Net 语言的相对使用/流行度的统计数据.谢谢. 解决方案 如果你认为 Stackoverflow 是平等和公平的,那么就看看 标签 页面. C# - 截至 09 年 8 月 21 日上午 9:30
..
我有两个数据帧,我想对行进行独立的 2 组 t 检验(即 t.test(y1, y2) 其中 y1 是dataframe1 中的一行和 y2 匹配 dataframe2 中的一行) 实现这一目标的最佳方法是什么? 编辑:我刚刚找到了格式:dataframe1[i,] dataframe2[i,].这将在循环中工作.这是最好的解决方案吗? 解决方案 您概述的方法是合理的,只需确保
..
非常感谢您对此的意见! 我正在研究逻辑回归,但由于某种原因它不起作用: mod1 当我用更少的数据运行相同的模型时,它就起作用了!但是对于完整的数据集,我收到一条错误和警告消息: 错误:内循环1;无法修正步长此外: 警告消息:1:由于发散而截断步长2:由于发散而截断步长 这是数据:https://www.dropbox.com/s/8ib8m1fh176556h/NSSH1.csv?
..
我想在 data.table 中调用一个函数来计算一组汇总统计数据,如下所示: summ.stats
..
在 JavaScript 中获取 [0, n) 范围内随机整数的标准方法 - 或任何其他仅提供 random() 函数返回 [0,1) 范围内浮点数的语言 - 是使用Math.floor(Math.random() * n). 现在,假设我们正在对一组有理数进行运算,那么这背后的数学是微不足道的.问题是:由于 IEEE-754 浮点数的所有复杂性,结果分布实际上真的是均匀的吗? 考虑到
..
我对自由度为 178 的双尾 t 检验进行了线性回归.summary 函数为我的两个 t 值提供了两个 p 值. t 值 Pr(>|t|)5.06 1.04e-06 ***10.09 <2e-16 ***......F 统计量:101.8 在 1 和 178 DF 上,p 值: 我想用这个公式手动计算 t 值的 p 值: p = 1 - 2*F(|t|)p_value_1 我没有得到
..
我有一个很大的双精度数组,我需要计算数组的第 75 个和第 90 个百分位值.通过函数执行此操作的最有效方法是什么? 解决方案 统计已经有一段时间了,所以我可以离开这里 - 但这里有一个裂缝. function get_percentile($percentile, $array) {排序($数组);$index = ($percentile/100) * count($array);如
..
我想比较来自两个不同索赔付款人的 CPT 代码的成本.两者都有平价和非平价供应商.我正在使用 dplyr 和 modeest::mlv,但它没有按预期工作.这是一些示例数据; source CPTCode ParNonPar Key net_paid PaidFreq seqABC 100 Y ABC100Y -341.00 6 1ABC 100 Y ABC100Y 0.00 2 2ABC 10
..
我正在运行一些蒙特卡罗模拟并广泛使用 Excel 函数
..
我需要找到多项式回归线,并且我正在使用 PHP - 是否有库或第三部分脚本可以为我执行此操作?如果它也可以做方差分析,那将是一个奖励,但主要是我需要找到回归线. 我不知道如何计算多项式趋势线,我怀疑我自己学习如何计算太难了,所以如果其他人有一个脚本,我想使用它.我也愿意使用另一个可以从 php 调用的程序(所以只有命令行 - 没有 gui),但我更愿意坚持使用 php. 解决方案
..
Python 中的谐波平均函数 (scipy.stats.hmean) 要求输入为正数. 例如: from scipy import stats打印 stats.hmean([ -50.2 , 100.5 ]) 结果: ValueError:谐波均值仅在所有元素都大于零时定义 我不明白为什么会出现这种情况,除了在极少数情况下您最终会被零除.hmean() 不是检查除以零,而是在输入任
..