statistics相关内容

使用 R 中的斜坡包为线性混合模型指定相关结构

我正在尝试创建一个线性混合模型 (lmm),它允许点之间的空间相关性(每个点都有纬度/经度).我希望空间相关性基于点之间的大圆距离. ramps 包包含一个计算“haversine"距离的相关结构——尽管我在实现它时遇到了麻烦.我以前使用过其他相关结构(corGaus、corExp)并且没有任何困难.我假设可以以相同的方式实现带有“haversine"度量的 corRGaus. 我能够 ..
发布时间:2022-01-07 23:41:54 其他开发

使用 Scipy 与 Matlab 拟合对数正态分布

我正在尝试使用 Scipy 拟合对数正态分布.我之前已经使用 Matlab 完成了它,但由于需要将应用程序扩展到统计分析之外,我正在尝试在 Scipy 中重现拟合值. 以下是我用来拟合数据的 Matlab 代码: % 读取输入数据(每行一个值)x = [];fid = fopen(file_path, 'r');% 读数是 fopen 的默认操作disp('正在读取网络度数数据...'); ..
发布时间:2022-01-07 23:41:30 Python

为什么 PCA 降低了 Logistic 回归的性能?

我用50000 X 370维的数据对一个二元分类问题进行了Logistic回归.我得到了大约90%的准确率.但是当我对数据做PCA+logistic时,我的准确率下降到了10%,我很震惊看到这个结果.谁能解释一下可能出了什么问题? 解决方案 不能保证 PCA 会帮助或损害学习过程.特别是 - 如果您使用 PCA 来减少维度数量 - 您正在从数据中删除信息,因此一切都可能发生 - 如果删除的 ..

我对 Davies-Bouldin 索引的 Python 实现是否正确?

我正在尝试计算 Davies-Bouldin 指数Python. 以下是代码尝试重现的步骤. 5 个步骤: 对于每个集群,计算每个点到质心的欧几里德距离 对于每个集群,计算这些距离的平均值 对于每对集群,计算它们的质心之间的欧几里德距离 那么, 对于每对聚类,求到它们各自质心的平均距离之和(在第 2 步计算),然后除以它们之间的距离(在第 3 步计算). 最 ..
发布时间:2022-01-07 23:41:07 Python

如何为 binned_statistic 制作用户定义的函数

我正在使用 scipy stats 包沿轴获取统计信息,但我无法使用 binned_statistic 获取百分位数统计信息.我已经概括了下面的代码,我试图在一系列 x 箱中使用 x、y 值的数据集的第 10 个百分位数,但它失败了. 我当然可以使用 np.std 进行函数选项,例如中值,甚至是 numpy 标准差.但是,我无法弄清楚如何使用 np.percentile 因为它需要 2 个参 ..
发布时间:2022-01-07 23:40:52 Python

如何遍历 SPSS 中的变量?我想避免代码重复

是否有“原生"SPSS 方法来循环遍历某些变量名称?我想要做的就是获取一个变量列表(我定义的)并为它们运行相同的过程: 伪代码 - 不是一个很好的例子,但可以理解... for i in varlist['a','b','c']做频率变量=变量列表[i]/顺序=分析.结尾 我注意到人们似乎只是使用 R 或 Python SPSS 插件来实现这个基本的数组功能,但我不知道我多久可以在我的 ..
发布时间:2022-01-07 23:40:44 其他开发

使用 ggplot2 如何在图例中表示点和线

使用 ggplot2 我正在绘制几个函数和一系列点.我不知道如何表示图例上的点.我意识到我需要使用 aes() 函数,但我不完全明白如何做到这一点.我很抱歉这个例子太长了,但我不知道如何说明它. ## 添加 ggplot2图书馆(ggplot2)# 声明图表值y_label = expression("y_axis"~~bgroup("(",val/km^{2},")"))x_label = " ..
发布时间:2022-01-07 23:40:35 其他开发

如何从 sklearn GridSearchCV 获取 MSE 和 R2?

我可以在管道上使用 GridSearchCV 并将评分指定为 'MSE' 或 'R2'.然后我可以访问 gridsearchcv._best_score 来恢复我指定的那个.如何获得 GridSearchCV 找到的解决方案的其他分数? 如果我使用另一个评分参数再次运行 GridSearchCV,它可能找不到相同的解决方案,因此它报告的分数可能与我们拥有第一个值的模型不对应. 也许我可 ..
发布时间:2022-01-07 23:40:27 AI人工智能

如何在 MatLab 中绘制概率密度函数?

x = [1 2 3 3 4]cdfplot(x) 谷歌搜索后,我发现上面的代码会在Matlab中为我绘制一个累积分布函数. 有没有简单的方法可以画出概率密度函数? 澄清.我需要一个具有均匀分布的 x 轴的图.我希望它看起来不像条形图.(我会有数百万个整数) 不好意思,又来更新了.我的数据是整数,但实际上它们代表时间(我期望在完全相同的值下有几个相当高的峰值,而其他值应该看起来好像它们 ..
发布时间:2022-01-07 23:40:18 其他开发

k-means:每次执行相同的集群

是否有可能为特定数据集的每次执行获得相同的 kmeans 集群.就像对于随机值一样,我们可以使用固定种子.是否可以停止聚类的随机性? 解决方案 是的.在进行聚类之前,使用 set.seed 为随机值设置种子. 使用kmeans中的例子: set.seed(1)x 测试相等性: 相同(XX, YY)[1] 真 ..
发布时间:2022-01-07 23:40:09 其他开发

ggplot2 中 geom_line 的两个色阶

我有一个图表(要复制的代码将在下面),其中有两行(和点)需要进行颜色编码的数据,然后是三组需要有自己的颜色编码的置信区间(线). 不幸的是,ggplot 看到了对 geom_line() 的两次调用,并将它们都放在相同的比例中. 有没有办法让中心线和点有一个比例尺(和图例条目)而外线有一个单独的比例尺(和图例条目)? 我见过(复杂的)答案,例如 ggplot2:多个色阶或在不同层 ..
发布时间:2022-01-07 23:39:49 其他开发

获得“NA"当我运行标准偏差时

快速提问.我将我的 csv 文件读入变量 data.它有一个列标签 var,其中包含数值. 当我运行命令时 sd(data$var) 我明白了 [1] 不适用 而不是我的标准偏差. 你能帮我弄清楚我做错了什么吗? 解决方案 尝试 sd(data$var, na.rm=TRUE) 然后将忽略列 var 中的任何 NA.还将支付检查您的数据以确保 NA 应该是 NA 并且没 ..
发布时间:2022-01-07 23:39:31 其他开发

确定 ASP.NET 站点的“活动"用户数

在 ASP.NET 站点上,有哪些技术可用于跟踪在任何给定时间点登录该站点的用户数量? 例如,我可以生成一个报告,显示如下内容: 10:00am 11:00am 12:00pm 1:00pm 2:00pm ....3/25 25 32 45 40 373/26 31 38 50 57 403/27 28 37 46 35 20等等. 编辑:不,我们没有使用 ASP.NET 成员资格提供 ..
发布时间:2022-01-07 23:38:56 C#/.NET

WebRTC getStat() API 设置

我正在尝试使用 WebRTC 的 api 中的 getStat() 来查看它是否提供了任何有用的信息测量延迟和其他视频流数据.问题是关于如何使用它的信息并不多.即使是较旧的现有示例也非常罕见,但此后 api 已经发生了变化. 例如,我的设置: peerconnection.getStats(function(stats) {控制台日志(统计);})); 这将返回一个带有 2 个函数的 R ..
发布时间:2022-01-07 23:38:40 其他开发

拟合 3 参数威布尔分布

我一直在用 R 进行一些数据分析,我正在尝试弄清楚如何将我的数据拟合到 3 参数 Weibull 分布.我找到了如何使用 2 参数 Weibull 进行操作,但在找到如何使用 3 参数进行操作时遇到了问题. 以下是我使用 MASS 包中的 fitdistr 函数拟合数据的方法: y x[[6]] 是我的数据的一个子集,y 是我存储拟合结果的地方. 解决方案 首先,您可能需要查看 ..
发布时间:2022-01-07 23:38:22 其他开发