statistics相关内容

在多对列上提取和格式化 cor.test 的结果

我正在尝试生成相关矩阵的表格输出.具体来说,我使用 for 循环来确定第 4:40 列到第 1 列中所有数据之间的相关性.虽然该表的结果不错,但它不能确定正在比较的内容到什么.在检查 cor.test 的属性时,我发现 data.name 被指定为 x[1] 和 y[1] 这是不足以追溯哪些列正在与哪些列进行比较.这是我的代码: input ..
发布时间:2022-01-07 23:46:38 其他开发

R:在 2x2 窗口中并排放置四个 Lattice 条形图?

我想并排制作 2x2 条形图的代码,以便 y 轴最大值在所有和 常用标签 常见的xlabel 常见的传说 通用标题 每个条形图都有自己的副标题 每个条形图之间的分隔线,如图 2 所示 代码 # 想要输出 2x2 条形图,其中顶部列 Ite.1 和伊特.2 和行名称女性和男性# http://www.magesblog.com/2012/12/changed-colours- ..
发布时间:2022-01-07 23:46:23 其他开发

将参数传递给 dplyr 汇总函数

我正在尝试使用 dplyr 中的汇总函数来计算汇总统计数据,该函数使用两个参数函数从连接的数据库中传递表和字段名称.不幸的是,一旦我用另一个函数包装汇总函数,结果就不正确.结束表是一个不遍历每一行的数据帧.我将在下面显示输入/输出: 汇总统计函数图书馆(dplyr) data%总结(计数 = n(),min = min(table[[field]], na.rm = T),mean = m ..
发布时间:2022-01-07 23:46:10 其他开发

在 MATLAB 中估计直方图的偏度

我可以在 MATLAB 中做哪些测试来测试直方图的传播?例如,在给定的一组直方图中,我只对 1、2、3、5 和 7(从左到右,从上到下)感兴趣,因为它们的分布较少.如何获得一个值来告诉我直方图是否正偏斜? 可能可以使用卡方检验,但我不确定 MATLAB 代码是什么. 解决方案 您可以使用标准偏度的定义.换句话说,您可以使用: 您计算数据的平均值,然后使用上述等式计算偏度.正偏度 ..
发布时间:2022-01-07 23:45:55 其他开发

多评价者数据的评价者间可靠性计算

我有以下列表: [[1, 1, 1, 1, 3, 0, 0, 1],[1, 1, 1, 1, 3, 0, 0, 1],[1, 1, 1, 1, 2, 0, 0, 1],[1, 1, 0, 2, 3, 1, 0, 1]] 在我想计算 inter-rater 可靠性分数的地方,有多个评分者(行).我不能使用 Fleiss 的 kappa,因为行的总和不是相同的数字.在这种情况下,什么是好的方法? ..
发布时间:2022-01-07 23:45:30 Python

自动比较两个系列-相异性检验

我有两个系列,系列 1 和系列 2.我的目标是自动/定量地找出Series2 与Series1 有多少不同,在bin 到bin 的基础上(每个bin 代表一个特定的特征). 可以通过 点击此处. Series1 是预期的结果.系列 2 是测试/传入系列. 我提供了一个直方图,其中 Series2 以深棕色表示.您还可以注意到 x 轴在 221 和 353 之间存在显着差异.即 Seri ..
发布时间:2022-01-07 23:45:22 C/C++开发

如何使用 R 的 topicmodels 包中的 LDA 函数重现精确结果

我一直无法从 topicmodels 的 LDA 函数中创建可重现的结果.以他们的文档为例: 库(主题模型)设置种子(0)lda1 如何从对 LDA 的两次单独调用中获得相同的结果? 顺便说一句(以防软件包作者在这里),我发现 control=list(seed=0) 片段很不幸且不必要.在幕后,有一行表示 if (missing(seed)) seed .这不会使过程更可靠地随机,它 ..
发布时间:2022-01-07 23:45:11 其他开发

2x4 Lattice Barchart 在 R 中最低限度?

两个不同测量会话的两个数据文件:ECG 和 B ECG.每个数据文件包含男性和女性.我想在 R 中最低限度地做 2 列 x 4 行 Lattice Barchart,其中以下是界面的草图.我可以做 2x2 条形图,请参阅下面的代码.肯定有一些比手动添加越来越多的行到代码末尾更简单的方法,这很难控制. ECG B.ECG女 女窦到达/AHB地高辛呋塞米心电图 B.ECG男 男窦到达/AHB地高辛 ..
发布时间:2022-01-07 23:44:59 其他开发

将带有嵌入引号的 csv 文件读入 R

我必须使用这样的 .csv 文件: "IDEA ID,""IDEA TITLE"",""VOTE VALUE""""56144,""净现值加 (NPV+)"",1""56144,""净现值加 (NPV+)"",1" 如果我使用 read.csv,我会获得一个带有一个变量的数据框.我需要的是一个包含三列的数据框,其中的列用逗号分隔.如何处理行首和行尾的引号? 解决方案 我建议删除初始/终 ..
发布时间:2022-01-07 23:44:38 其他开发

使用不同的 .Net 语言?

是否有可用的不同.Net 语言的流行度细分?有没有人知道提供这些信息的任何调查,或者是否有可能确定这一点? 更新 答案是不是不同 .Net 语言的列表.我希望看到显示每种 .Net 语言的相对使用/流行度的统计数据.谢谢. 解决方案 如果你认为 Stackoverflow 是平等和公平的,那么就看看 标签 页面. C# - 截至 09 年 8 月 21 日上午 9:30 ..
发布时间:2022-01-07 23:44:29 C#/.NET

R:对 2 个数据帧的行进行 t 测试

我有两个数据帧,我想对行进行独立的 2 组 t 检验(即 t.test(y1, y2) 其中 y1 是dataframe1 中的一行和 y2 匹配 dataframe2 中的一行) 实现这一目标的最佳方法是什么? 编辑:我刚刚找到了格式:dataframe1[i,] dataframe2[i,].这将在循环中工作.这是最好的解决方案吗? 解决方案 您概述的方法是合理的,只需确保 ..
发布时间:2022-01-07 23:44:19 其他开发

逻辑回归返回错误,但在减少的数据集上运行正常

非常感谢您对此的意见! 我正在研究逻辑回归,但由于某种原因它不起作用: mod1 当我用更少的数据运行相同的模型时,它就起作用了!但是对于完整的数据集,我收到一条错误和警告消息: 错误:内循环1;无法修正步长此外: 警告消息:1:由于发散而截断步长2:由于发散而截断步长 这是数据:https://www.dropbox.com/s/8ib8m1fh176556h/NSSH1.csv? ..
发布时间:2022-01-07 23:44:12 其他开发

使用浮点源的整数均匀分布

在 JavaScript 中获取 [0, n) 范围内随机整数的标准方法 - 或任何其他仅提供 random() 函数返回 [0,1) 范围内浮点数的语言 - 是使用Math.floor(Math.random() * n). 现在,假设我们正在对一组有理数进行运算,那么这背后的数学是微不足道的.问题是:由于 IEEE-754 浮点数的所有复杂性,结果分布实际上真的是均匀的吗? 考虑到 ..
发布时间:2022-01-07 23:43:41 前端开发

如何从 PHP 中的双精度数组计算第 n 个百分位数?

我有一个很大的双精度数组,我需要计算数组的第 75 个和第 90 个百分位值.通过函数执行此操作的最有效方法是什么? 解决方案 统计已经有一段时间了,所以我可以离开这里 - 但这里有一个裂缝. function get_percentile($percentile, $array) {排序($数组);$index = ($percentile/100) * count($array);如 ..
发布时间:2022-01-07 23:42:59 PHP

如何在R中总结一个组的模式

我想比较来自两个不同索赔付款人的 CPT 代码的成本.两者都有平价和非平价供应商.我正在使用 dplyr 和 modeest::mlv,但它没有按预期工作.这是一些示例数据; source CPTCode ParNonPar Key net_paid PaidFreq seqABC 100 Y ABC100Y -341.00 6 1ABC 100 Y ABC100Y 0.00 2 2ABC 10 ..
发布时间:2022-01-07 23:42:41 其他开发

是否有 PHP 的统计库?

我需要找到多项式回归线,并且我正在使用 PHP - 是否有库或第三部分脚本可以为我执行此操作?如果它也可以做方差分析,那将是一个奖励,但主要是我需要找到回归线. 我不知道如何计算多项式趋势线,我怀疑我自己学习如何计算太难了,所以如果其他人有一个脚本,我想使用它.我也愿意使用另一个可以从 php 调用的程序(所以只有命令行 - 没有 gui),但我更愿意坚持使用 php. 解决方案 ..
发布时间:2022-01-07 23:42:21 PHP

python中的调和平均值

Python 中的谐波平均函数 (scipy.stats.hmean) 要求输入为正数. 例如: from scipy import stats打印 stats.hmean([ -50.2 , 100.5 ]) 结果: ValueError:谐波均值仅在所有元素都大于零时定义 我不明白为什么会出现这种情况,除了在极少数情况下您最终会被零除.hmean() 不是检查除以零,而是在输入任 ..
发布时间:2022-01-07 23:42:12 Python