statistics相关内容

第N个组合

是否可以直接获得nCr所有组合的有序集合的第N个组合? 示例:我有四个要素:[6、4、2、1].一次取三个,所有可能的组合为: [[6,4,2],[6,4,1],[6,2,1],[4,2,1]]. 有没有一种算法可以给我例如排序结果集中的第三个答案[6,2,1],而没有枚举所有先前的答案? 解决方案 请注意,您可以通过递归生成具有第一个元素的所有组合,然后不生成所有组合来生成序 ..
发布时间:2020-05-06 10:26:41 其他开发

在Python中计算算术平均值(一种平均值)

Python中是否有内置或标准库方法来计算数字列表的算术平均值(一种平均值)? 解决方案 我不知道标准库中的任何内容.但是,您可以使用类似以下内容的 : def mean(numbers): return float(sum(numbers)) / max(len(numbers), 1) >>> mean([1,2,3,4]) 2.5 >>> mean([]) 0.0 ..
发布时间:2020-05-06 10:24:51 Python

什么是检测折线图细分的正确算法?

具体而言,给定2D数值数据,如下线图所示.在背景平均运动(振动很小)上有峰值.如果这些峰值下降到平均值,我们想找到对(x1,x2)的值;或(x1)仅在该行未返回平均值时. 有成千上万个这样的2D数据. 什么是正确的统计或机器学习算法,无需绘制就可以找到上面的x1和x2? 解决方案 请注意,这不是确切答案. 我真的不知道您要做什么.但我可以建议您一种方法.假设图中只有一个峰,并且 ..
发布时间:2020-05-04 10:27:25 AI人工智能

缺失值和偏差的排名算法

问题是: 一组5个独立用户,需要对给他们的50种产品进行评分.用户可能会在某个时间点使用全部50种产品.一些用户对某些产品有更大的偏见.一位用户没有真正完成调查,而是给出了随机值.用户不必对所有产品进行评分.现在给出4个样本数据集,根据评分对产品进行排名 datset : product #user1 #user2 #user3 #user4 #user5 0 29 ..

以稳定的方式找到曲线的弯头?

我知道我唯一的问题是肘点似乎从我的代码的不同实例中改变.观察这篇文章中显示的两个图.尽管它们在视觉上看起来相似,但肘点的值发生了显着变化.两条曲线均来自平均20次不同的运行.即使那样,肘点的值也有明显的变化.我可以采取哪些预防措施来确保该值落在某个范围内? 我的尝试如下所示: def elbowPoint(points): secondDerivative = collection ..

神经网络具有正态分布的数据重要吗?

因此,处理数据的标准操作之一是将其标准化并标准化以使其具有正态分布的数据,均值0且标准差为1,对吗?但是,如果数据不是正态分布的怎么办? 此外,所需的输出是否也必须服从正态分布吗?如果我希望我的前馈网络在两个类别(-1和1)之间进行分类,那将不可能标准化为均值0和std为1的正态分布呢? 前馈网是非参数的,对吗?因此,如果是的话,对数据进行标准化处理是否仍然很重要?为何人们对此予以认同 ..

如何区分结构化和非结构化数据?

结构化数据和非结构化数据之间有什么区别? 这种差异如何影响相应的数据挖掘方法? 解决方案 我熟悉的术语是结构化和非结构化数据(与Q中的内容相同,除了作为后缀). 我在机器学习中使用两种类型的数据,并且我不知道任何正式的定义;但是,我怀疑几乎所有需要在这两种类型的数据之间进行区分的工作的人都不会轻易区分它们. 结构化数据示例:发送电子邮件的日期/时间;是否具有附件或电子邮件发件人 ..
发布时间:2020-05-04 09:46:47 AI人工智能

XGBoost CV和最佳迭代

我正在使用XGBoost cv为我的模型找到最佳的回合数.如果有人可以确认(或反驳),我将不胜感激,最佳的回合数是: estop = 40 res = xgb.cv(params, dvisibletrain, num_boost_round=1000000000, nfold=5, early_stopping_rounds=estop, seed=SEED, strati ..
发布时间:2020-05-04 09:42:56 AI人工智能

从二元高斯分布产生均值

我正在阅读 ESLII 的统计学习内容,在第2章中,他们有一个高斯混合数据集来说明一些学习算法.为了生成此数据集,他们首先从二元高斯分布N((1,0)',I)中生成10个均值.我不确定它们是什么意思? 如何从均值(1,0)的双变量分布中生成10个均值? 解决方案 从二元高斯分布生成的均值中的每一个均是单点采样,其采样方式与可从均方根生成的任何其他随机点完全相同.分配.他们使用这些生成 ..
发布时间:2020-05-04 09:42:23 AI人工智能

PyTorch-参数不变

为了了解pytorch的工作原理,我试图对多元正态分布中的某些参数进行最大似然估计.但是,它似乎不适用于任何与协方差相关的参数. 所以我的问题是:为什么这段代码不起作用? import torch def make_covariance_matrix(sigma, rho): return torch.tensor([[sigma[0]**2, rho * torch.pr ..
发布时间:2020-05-04 09:38:55 AI人工智能