statistics 第3页 - IT屋-程序员软件开发技术分享社区

R 和 Python 给出不同的结果(中值、IQR、平均值和 STD)

我正在对我的数据进行特征缩放，而 R 和 Python 在缩放方面给了我不同的答案.R 和 Python 对许多统计值给出了不同的答案: 中位数:Numpy 给 14.948499999999999 和这个代码:np.percentile(X[:, 0], 50,interpolation = 'midpoint').Python 中内置的 Statistics 包通过以下代码给出了相同的答 ..

发布时间：2022-01-08 00:01:22 python r numpy statistics Python

ggplot2 中的蠕虫图残差图

我正在尝试在使用 gamlss 包中的 gamlss 函数拟合的模型上绘制蠕虫图残差.兴趣图如下所示: 最初，下面是参考使用childsds包中的wormplot_gg函数的计算例程，但是，使用上述函数表达的结果并不是看起来就像上面显示的例子一样，它被应用于包含在 R 中的数据集. 库(ggplot2)图书馆(无游戏)图书馆(childsds)头(橙色)Dados ..

发布时间：2022-01-08 00:00:59 r ggplot2 statistics regression gamlss 其他开发

使用 sparklyr 中的 dplyr 计算每列中唯一元素的数量

我正在尝试计算 spark 数据集 s 中每列中唯一元素的数量. 然而，spark 似乎无法识别 Tally()k%group_by(grouping_type)%>%summarise_each(funs(tally(distinct(.)))))错误:org.apache.spark.sql.AnalysisException:未定义的函数TALLY spark 似乎也无法识别简单 ..

发布时间：2022-01-08 00:00:50 r apache-spark statistics dplyr sparklyr 其他开发

TrafficStats 函数总是返回 -1

当我尝试使用 TrafficStats 类检索交通数据时， TrafficStats.getTotalRxBytes() 和 TrafficStats.getTotalTxBytes() 函数总是返回 -1，即使我使用浏览器加载一些网页. 我从一些论坛得知 -1 表示设备不支持该操作.我使用了 WVGA、NEXUS ONE 和 NEXUS S，但问题仍然存在. 谢谢. 解决 ..

发布时间：2022-01-08 00:00:03 android networking statistics traffic-measurement 移动开发

模行为背后的数学

序言这个问题与 (P)RNG 和 rand() 的行为无关.这是关于使用对模均匀分布的两个值的幂. 简介我知道不应该使用模 % 将值从一个范围转换为另一个值，例如从 rand() 功能:会有偏差.这里解释了 https://bitbucket.org/haypo/hasard/src/ebf5870a1a54/doc/common_errors.rst?at=default ..

发布时间：2022-01-07 23:59:37 math random statistics probability modulo 其他开发

在 Matlab 中计算二维点列表的熵

我有一个像这样的数组中的点列表 points = [[1,2];[2,5];[7,1]...[x,y]] x 在 0 到 1020 之间，y 在 0 到 1920 之间. 如何在 Matlab 中计算点数组的熵? 非常感谢！解决方案我假设您想将每个 [x,y] 点视为一个数据点.让我们定义一些示例数据: A = [[1,2];[2,5];[7,1];[1,2]]; ..

发布时间：2022-01-07 23:59:27 arrays matlab statistics data-analysis entropy 其他开发

根据另一列的相应行值创建行的子集?

#让CSV包含两列“年龄"；和“性别"其中: 年龄 = [30, 24, 55, 61, 70, 21]性别 = [男、女、男、男、男、女] #我希望它显示与 Gender=“Male"对应的 Age 的所有值(以及值的数量).和“女性"相同使用数据帧 #所以这就是我尝试的 julia>df= CSV.read(raw"Clocation)", DataFrame)朱莉娅>df.年 ..

发布时间：2022-01-07 23:59:06 vector statistics dataset julia subset 其他开发

statsmodels 的 OLS 不适用于成反比的数据?

我正在尝试使用一些成反比的数据执行普通最小二乘回归，但似乎拟合结果是错误的? 导入 statsmodels.formula.api 作为 sm将 numpy 导入为 np导入 matplotlib.pyplot 作为 plty = np.arange(100, 0, -1)x = np.arange(0, 100)结果 = sm.OLS(y, x).fit()图, ax = plt.subplo ..

发布时间：2022-01-07 23:58:57 python statistics regression linear-regression statsmodels Python

GCC 链接器:如何在输出部分生成每个文件贡献的报告

最近我在尝试链接我的程序时遇到问题.它报告 .text 不能放入指定的内存区域.显然，源代码太大而无法在有限的内存区域内链接. 我现在要做的是分析哪个文件对“.text"部分的贡献最大，以便可以执行后续代码优化.我尝试了很多方法，但没有成功. nm -s output.elf 给出每个符号的大小，但不要在每个源文件下将符号分组. nm -s file.obj 遍历每个目标文件不起作用 ..

发布时间：2022-01-07 23:58:35 gcc hyperlink statistics out-of-memory 其他开发

谷歌图表直方图的公式

Google Charts 使用什么公式来构建直方图?例如，它是否使用 Sturge 规则?多恩法则?斯科特的规则?等.是否有任何关于它如何构建默认 bin 大小、最小值和最大值的文档? 这是直方图 Google 图表页面. Google Charts 会自动为您选择 bin 数量.所有 bin 的宽度相等，高度与 bin 中数据点的数量成正比.在其他方面，直方图类似于柱状图. ..

发布时间：2022-01-07 23:58:21 charts statistics google-visualization histogram binning 其他开发

在 R 中循环文件

我正在使用 R 来计算文件中列的平均值，如下所示: Rfile1 = read.table("x01")意思是(文件1$V4) 但是，我没有使用 R 构建循环的经验，只能使用 bash.我如何将其转换为一个循环，为文件夹中的每个文件执行此操作，并将输出保存到一个文件中，文件名和平均值作为每行的 2 列?例如: x01(或 file1，如果更简单) 23.4x02 25.4x03 10.4 ..

发布时间：2022-01-07 23:58:16 r loops statistics 其他开发

通过算法比较许多客户的多个价格选项

我们有 1,000,000 名客户.每种商品的销售成本可以表示为价格 A 或价格 B. 价格A 价格 A 和价格 B 不是线性关系.在某些情况下，B 的价格是其 2 倍，在某些情况下是 100 倍. A 上所有客户的成本是 min( (sum(A)/count(A)) , 100 ) * count(A)实际上，如果 A 上的所有客户的平均成本小于 100，则将向上取整为 10 ..

发布时间：2022-01-07 23:58:00 python algorithm optimization statistics branch-and-bound Python

如何为另一个连续变量的线性回归绘制两个固定分类值的比较

所以我想绘制这个: lmfit = lm (y ~ a + b) 但是，“b"只有零和一的值.所以，我想绘制两条相互平行的独立回归线，以显示 b 对 y 截距的差异.所以在绘制这个之后: 绘图(b，y) 然后我想使用 abline(lmfit,col="red",lwd=2) 两次，一次将 b 的 x 值设置为零，一次将其设置为 1.所以有一次没有包含这个词，有一次 b 只 ..

发布时间：2022-01-07 23:57:50 r plot statistics linear-regression 其他开发

如何在 Haskell 中计算直方图?

我找到了 Statistics.Sample.Histogram，但我似乎无法使用它.如果我希望能够将列表分为四类，我希望能够执行以下操作: import Statistics.Sample.Histogram直方图 4 [1, 2, 9, 9, 9, 9, 10, 11, 20] 但它给了我错误“约束中的非类型变量参数"，我根本不明白.我究竟做错了什么? 解决方案 histogram ..

发布时间：2022-01-07 23:57:43 haskell statistics 其他开发

零截距模型的 lm() 中的 R 平方

我在 R 中运行了一个 lm()，这是总结的结果: 多个 R 平方:0.8918，调整后的 R 平方:0.8917F 统计量:9416 和 10283 DF，p 值: 而且它似乎是一个很好的模型，但是如果我手动计算 R^2，我会得到这个: model=lm(S~0+C+HA+L1+L2,data=train)预测=预测(模型，火车)rss ..

发布时间：2022-01-07 23:57:22 r statistics linear-regression least-squares 其他开发

使用蒙特卡罗模拟计算方差的期望值

所以我有这个概率分布 X = {0 概率 7/8} {1/60 概率 1/8} James 他的车一年出故障 N 次，其中 N ~ Pois(2) 和 X 是修理成本，Y 是 James 在一年内造成的总成本. 我想计算 E[Y] 和 V(Y)，这应该给我 E[X]=15 和 V(Y) = 1800 我有这个蒙特卡罗模拟: expon_dis 此代码给出的预期值为 ..

发布时间：2022-01-07 23:57:12 r statistics montecarlo stochastic 其他开发

如何在合并提交中列出已解决冲突的统计信息?

在合并分支时，可能会发生冲突，我们应该解决该冲突以完成合并.我们如何仅列出合并中已解决冲突的统计信息? 解决方案 TL;DR answer: 尝试一下. 分支在 git 中的成本为零，因此只需创建几个 test_merge_source 和 test_merge_destination 分支并开始合并.5 到 10 分钟后，您要么完成，要么由于发生了一些/一些/许多冲突，您还剩下一点 ..

发布时间：2022-01-07 23:56:55 git merge statistics commit 其他开发

Matlab - 将连续数据转换为离散数据

是否有任何技术可用于将连续数据转换为离散数据? 通过连续数据，我指的是各种函数生成的输出值.例如，为不同数据点集的熵生成的值. 如果有，Mathworks File Exchange 的 Matlab 中是否有可用的实现? 解决方案更准确的答案是您需要对数据进行分箱.这可以通过任意拆分或基于数据本身的分位数拆分来完成.基础 Matlab 系统提供对分位数 (quantile) ..

发布时间：2022-01-07 23:56:41 matlab statistics 其他开发

R:Boxplot - 如何向下移动 x 轴标签?

#RGR ~ 处理:Geno boxplot适合 ..

发布时间：2022-01-07 23:56:35 r statistics axis-labels 其他开发

如何获得按键分组的平均值和标准偏差?

我需要找到这种格式的大量数据的平均值和标准偏差.我尝试使用 Excel，但似乎没有一种简单的方法来转置列.我在 Excel 中缺少什么还是应该只使用 Perl? 输入文件格式为: 0 123 0 234 0 456 1 657 1 234 1 543 想要按第一列中的值对平均值和标准偏差进行分组的结果: 0 AvgOfAllZeros StdD ..

发布时间：2022-01-07 23:56:29 perl excel statistics 其他开发

statistics相关内容