statistics 第65页 - IT屋-程序员软件开发技术分享社区

第N个组合

是否可以直接获得nCr所有组合的有序集合的第N个组合? 示例:我有四个要素:[6、4、2、1].一次取三个，所有可能的组合为: [[6，4，2]，[6，4，1]，[6，2，1]，[4，2，1]]. 有没有一种算法可以给我例如排序结果集中的第三个答案[6，2，1]，而没有枚举所有先前的答案? 解决方案请注意，您可以通过递归生成具有第一个元素的所有组合，然后不生成所有组合来生成序 ..

发布时间：2020-05-06 10:26:41 math statistics probability combinatorics 其他开发

在Python中计算算术平均值(一种平均值)

Python中是否有内置或标准库方法来计算数字列表的算术平均值(一种平均值)? 解决方案我不知道标准库中的任何内容.但是，您可以使用类似以下内容的 : def mean(numbers): return float(sum(numbers)) / max(len(numbers), 1) >>> mean([1,2,3,4]) 2.5 >>> mean([]) 0.0 ..

发布时间：2020-05-06 10:24:51 python math statistics average mean Python

GDA的对数似然函数(高斯判别分析)

我难以理解Andrew Ng的CS229注释中给出的GDA的似然函数. l(φ，µ0，µ1，Σ)= log(从i到m的乘积){p(x(i)| y(i); µ0，µ1，Σ)p(y(i);φ) } 链接为 http://cs229.stanford.edu/notes/cs229-notes2 .pdf 第5页. 对于线性回归，函数是从i到m p(y(i)| x(i); theta) ..

发布时间：2020-05-04 10:27:35 machine-learning statistics probability gaussian AI人工智能

什么是检测折线图细分的正确算法?

具体而言，给定2D数值数据，如下线图所示.在背景平均运动(振动很小)上有峰值.如果这些峰值下降到平均值，我们想找到对(x1，x2)的值；或(x1)仅在该行未返回平均值时. 有成千上万个这样的2D数据. 什么是正确的统计或机器学习算法，无需绘制就可以找到上面的x1和x2? 解决方案请注意，这不是确切答案. 我真的不知道您要做什么.但我可以建议您一种方法.假设图中只有一个峰，并且 ..

发布时间：2020-05-04 10:27:25 python r machine-learning statistics regression AI人工智能

缺失值和偏差的排名算法

问题是: 一组5个独立用户，需要对给他们的50种产品进行评分.用户可能会在某个时间点使用全部50种产品.一些用户对某些产品有更大的偏见.一位用户没有真正完成调查，而是给出了随机值.用户不必对所有产品进行评分.现在给出4个样本数据集，根据评分对产品进行排名 datset : product #user1 #user2 #user3 #user4 #user5 0 29 ..

发布时间：2020-05-04 10:27:11 machine-learning statistics data-mining regression ranking-functions AI人工智能

分类任务中的所有二元预测变量

我正在使用R进行分析，我将实现四种算法. 1. RF 2. Log Reg 3. SVM 4. LDA 我有50个预测变量和1个目标变量.我所有的预测变量和目标变量都是二进制数字0s和1s. 我有以下问题: Should I convert them all into factors? Converting them into factors, and applying RF ..

发布时间：2020-05-04 10:11:30 r machine-learning statistics random-forest r-caret AI人工智能

熵和信息增益

我希望有一个简单的问题. 如果我有一组这样的数据: Classification attribute-1 attribute-2 Correct dog dog Correct dog dog Wrong dog cat Correct cat ..

发布时间：2020-05-04 10:08:40 statistics machine-learning information-theory AI人工智能

使用神经网络功能时出现错误

我在可用的波士顿数据集上尝试了R中的神经网络. data("Boston",package="MASS") data ..

发布时间：2020-05-04 10:06:25 r machine-learning statistics neural-network AI人工智能

以稳定的方式找到曲线的弯头?

我知道我唯一的问题是肘点似乎从我的代码的不同实例中改变.观察这篇文章中显示的两个图.尽管它们在视觉上看起来相似，但肘点的值发生了显着变化.两条曲线均来自平均20次不同的运行.即使那样，肘点的值也有明显的变化.我可以采取哪些预防措施来确保该值落在某个范围内? 我的尝试如下所示: def elbowPoint(points): secondDerivative = collection ..

发布时间：2020-05-04 10:03:12 python math statistics machine-learning numerical-methods AI人工智能

神经网络具有正态分布的数据重要吗?

因此，处理数据的标准操作之一是将其标准化并标准化以使其具有正态分布的数据，均值0且标准差为1，对吗?但是，如果数据不是正态分布的怎么办? 此外，所需的输出是否也必须服从正态分布吗?如果我希望我的前馈网络在两个类别(-1和1)之间进行分类，那将不可能标准化为均值0和std为1的正态分布呢? 前馈网是非参数的，对吗?因此，如果是的话，对数据进行标准化处理是否仍然很重要?为何人们对此予以认同 ..

发布时间：2020-05-04 10:02:43 machine-learning statistics neural-network normalization normal-distribution AI人工智能

在R中使用depmixS4拟合HMM时，NA/NaN/Inf错误

我正在尝试使用depmix将简单的隐藏markov模型拟合到R中.但是我有时会得到一些晦涩的错误(在外部函数调用中为Na/NaN/Inf).例如 require(depmixS4) t = data.frame(v=c(0.0622031327669583,-0.12564002739468,-0.117354660120178,0.0115062213361335,0.12299241 ..

发布时间：2020-05-04 10:02:09 r machine-learning statistics AI人工智能

计算相似度百分比或计算两个以上对象之间的相关性

考虑一下，我有四个对象(a,b,c,d)，我请五个人根据其外观或其他东西来标记它们(类别1或2).五个人为这些物体提供的标签显示为 df ..

发布时间：2020-05-04 09:58:02 r machine-learning statistics AI人工智能

如何正确删除Scikit-Learn的DPGMM的冗余组件?

我正在使用scikit-learn来实现Dirichlet过程高斯混合模型: https://github.com /scikit-learn/scikit-learn/blob/master/sklearn/mixture/dpgmm.py http://scikit-learn.org/stable/modules/generate/sklearn.mixture.BayesianGau ..

发布时间：2020-05-04 09:55:19 python python-3.x machine-learning statistics scikit-learn AI人工智能

R神经网络软件包-net.result显示什么?

使用以下代码，我构建了一个神经网络模型来预测收盘价: library(neuralnet) myformula ..

发布时间：2020-05-04 09:51:59 r machine-learning statistics neural-network AI人工智能

如何区分结构化和非结构化数据?

结构化数据和非结构化数据之间有什么区别? 这种差异如何影响相应的数据挖掘方法? 解决方案我熟悉的术语是结构化和非结构化数据(与Q中的内容相同，除了作为后缀). 我在机器学习中使用两种类型的数据，并且我不知道任何正式的定义；但是，我怀疑几乎所有需要在这两种类型的数据之间进行区分的工作的人都不会轻易区分它们. 结构化数据示例:发送电子邮件的日期/时间；是否具有附件或电子邮件发件人 ..

发布时间：2020-05-04 09:46:47 machine-learning statistics AI人工智能

XGBoost CV和最佳迭代

我正在使用XGBoost cv为我的模型找到最佳的回合数.如果有人可以确认(或反驳)，我将不胜感激，最佳的回合数是: estop = 40 res = xgb.cv(params, dvisibletrain, num_boost_round=1000000000, nfold=5, early_stopping_rounds=estop, seed=SEED, strati ..

发布时间：2020-05-04 09:42:56 python machine-learning statistics xgboost AI人工智能

从二元高斯分布产生均值

我正在阅读 ESLII 的统计学习内容，在第2章中，他们有一个高斯混合数据集来说明一些学习算法.为了生成此数据集，他们首先从二元高斯分布N((1,0)'，I)中生成10个均值.我不确定它们是什么意思? 如何从均值(1,0)的双变量分布中生成10个均值? 解决方案从二元高斯分布生成的均值中的每一个均是单点采样，其采样方式与可从均方根生成的任何其他随机点完全相同.分配.他们使用这些生成 ..

发布时间：2020-05-04 09:42:23 r statistics machine-learning gaussian AI人工智能

如何在R中计算KNN变量重要性

我实施了作者身份归因项目，在那里我能够使用KNN用来自两位作者的文章来训练我的KNN模型.然后，我将新文章的作者分类为作者A或作者B. 我使用knn()函数生成模型. 该模型的输出如下表. Word1 Word2 Word3 Author 11 1 48 8 A 2 2 0 0 B 29 1 45 9 ..

发布时间：2020-05-04 09:39:02 r machine-learning statistics classification AI人工智能

PyTorch-参数不变

为了了解pytorch的工作原理，我试图对多元正态分布中的某些参数进行最大似然估计.但是，它似乎不适用于任何与协方差相关的参数. 所以我的问题是:为什么这段代码不起作用? import torch def make_covariance_matrix(sigma, rho): return torch.tensor([[sigma[0]**2, rho * torch.pr ..

发布时间：2020-05-04 09:38:55 python machine-learning statistics pytorch AI人工智能

从networkX中的随机游走中获取节点列表

我是networkX的新手.我创建了一个图，如下所示: G = nx.read_edgelist(filename, nodetype=int, delimiter=',', data=(('weight', float),)) 边为正，但不等于1. 是否有 ..

发布时间：2020-05-04 09:37:32 python graph machine-learning statistics networkx AI人工智能

statistics相关内容