machine-learning相关内容

MATLAB kMeans并不总是收敛于全局最小值

我在MATLAB中编写了 k-Means聚类算法,我以为d在kmeans(X,k)中内置的MATLAB上进行尝试. 但是,对于非常简单的四个群集设置(请参见图片),MATLAB kMeans 并不总是收敛于最优解(左)而是收敛于(右). 我写的那个也不总是做到这一点,但是内置函数不应该总是能够找到最佳解决方案来解决这样一个简单的问题吗? 解决方案 作为您能做的最好的就是以随机的 ..
发布时间:2020-04-26 10:19:55 AI人工智能

PySpark中的KMeans聚类

我有一个包含许多列的spark数据框"mydataframe".我试图仅在两列上运行kmeans:纬度和经度(纬度和经度),将它们用作简单值).我想仅基于这两列提取7个聚类,然后将聚类分配附加到我的原始数据框中.我尝试过: from numpy import array from math import sqrt from pyspark.mllib.clustering import KM ..

K均值算法

可能的重复项: 如何在K中优化K-均值算法 在使用k-means聚类时如何确定k? 根据统计指标,我们可以决定K.例如标准差,均值,方差等, 或者 有什么简单的方法可以在K均值算法中选择K? 先谢谢了 纳文 解决方案 如果您明确想使用k-means,则可以研究描述均值移位聚类算法. 如果使用给定的数据在计算上可行(可能按照yura建议的那样使用采样),则可以使用 ..

加权Kmeans R

我想对具有三个变量(列)的数据集(即Sample_Data)进行Kmeans聚类,如下所示: A B C 1 12 10 1 2 8 11 2 3 14 10 1 . . . . . . . . . . . . 通常,在缩放列数并确定簇数之后,我将在R中使用此函数: Sample_Data ..
发布时间:2020-04-26 10:19:09 AI人工智能

ValueError:标签数为1.使用silhouette_score时,有效值为2到n_samples-1(包括1)

我正在尝试计算silhouette score,因为我找到了要创建的最佳群集数量,但是出现了一条错误消息: ValueError: Number of labels is 1. Valid values are 2 to n_samples - 1 (inclusive) 我无法理解其原因.这是我用来聚类和计算silhouette score的代码. 我读取了包含要聚类的文本的cs ..
发布时间:2020-04-26 10:19:03 AI人工智能

有关MATLAB中k均值聚类的查询

我有大量的矩阵形式的数据.我已经使用MATLAB R2013a中的k-means聚类对其进行了聚类.我想要形成的每个簇的质心的精确坐标.是否可以使用任何公式或其他方法? 我想找出每个聚类的质心,以便每当一些新数据到达矩阵时,我就可以计算出它与每个质心的距离,从而找出新数据将属于的聚类 我的数据本质上是异构的.因此,很难找到每个群集的平均数据.因此,我正在尝试编写一些代码以自动打印质心位 ..

在内核k均值(R中的kernlab软件包)中将新数据点分配给群集?

我对R的kernlab软件包中的kkmeans函数有疑问.我是此软件包的新手,如果我在这里缺少明显的内容,请原谅我. 我想为一组新的数据点分配一个群集,这些群集是使用具有功能"kkmeans"的内核k-means创建的.对于常规聚类,可以通过计算新数据点与聚类质心之间的欧几里得距离来实现,并选择具有最接近质心的聚类.在内核k均值中,必须在特征空间中执行此操作. 以kkmeans描述中使 ..
发布时间:2020-04-26 10:18:43 AI人工智能

如何实现K-Means ++算法?

我无法完全理解 K-Means ++算法 .我很感兴趣第一个k重心的选取方式,即初始化,其余的就像原始的 使用的概率函数是基于距离还是高斯? 同时,从另一个质心中选择最长的距离点作为新质心. 我将欣赏逐步说明和示例. 维基百科中的一个不够清晰.同样,注释良好的源代码也将有所帮助.如果您使用的是6个数组,请告诉我们哪个数组代表什么. 解决方案 有趣的问题.感谢您引起我的注意- K-M ..

KMeans的不平衡因子?

编辑: Spark中的总和变坏了 a> 在计算Kmeans成本中,我们看到了如何计算Kmeans的成本模型.我想知道我们是否能够计算不平衡因子? 如果Spark没有提供此类功能,是否有任何简单的方法来实现呢? 我无法找到不平衡因素的参考,但应该类似于Yael的unbalanced_factor(我的评论): // @hist: the number of points as ..
发布时间:2020-04-26 10:18:29 AI人工智能

Matlab:K-均值聚类

我有一个矩阵A(369x10),我想将其集群为19个集群. 我用这种方法 [idx ctrs]=kmeans(A,19) 产生 idx(369x1)和ctrs(19x10) 我到这里为止.我在A中的所有行都聚集在19个簇中. 现在我有一个数组B(49x10).我想知道在给定的19个簇中,这个B的行在哪里对应. 在MATLAB中怎么可能? 提前谢谢 解决方案 ..
发布时间:2020-04-26 10:18:25 AI人工智能

不知道簇数的Kmeans?

我正在尝试在一组高维数据点(大约50个维)上应用k均值,并且想知道是否有任何实现可以找到最佳数量的群集. 我记得在某处读过一种算法通常会这样做的方法,即,使集群间距离最大化而使集群内距离最小,但是我不记得在哪里看到了.如果有人可以指出任何讨论此事的资源,那就太好了.我目前正在将SciPy用于k均值,但任何相关库也都可以. 如果有其他方法可以实现相同或更好的算法,请告诉我. 解决方 ..
发布时间:2020-04-26 10:18:20 AI人工智能

是否可以使用scikit-learn K-Means聚类指定自己的距离函数?

是否可以使用scikit-learn K-Means聚类指定自己的距离函数? 解决方案 这是一个小型的kmeans,使用了20多个距离中的任何一个 scipy.spatial .distance 或用户功能. 欢迎发表评论(到目前为止,只有一个用户,这还不够); 尤其是您的N,dim,k,度量标准是什么? #!/usr/bin/env python # kmeans.py usin ..

选择c和gamma值

嗨,我正在使用SMO进行SVM分类,我的内核是RBF,现在我想使用网格搜索和交叉验证来选择 c 和 sigma 值,我是内核功能的新手,请逐步进行帮助 解决方案 选择一些您认为有趣的C和sigma值.例如,C = {1,10,100,1000}和sigma = {.01,.1,1}(我只是在弥补这些问题). 将训练集划分为 k 个(例如10个)部分,最好在遍历所有对C和sigma值. ..
发布时间:2020-04-25 11:24:07 AI人工智能

如何在Matlab中使用libsvm?

我是Matlab的新手,不知道如何使用libsvm.是否有用于通过SVM对某些数据(具有2个功能)进行分类,然后可视化结果的示例代码?用内核(RBF,多项式和Sigmoid)怎么样? 我在libsvm包中看到了该自述文件,但是我无法说明它的头还是尾,请您给出一个使用matlab中的支持向量机(SVM)对2类进行分类的示例,例如: Attribute_1 Attribute_2 Cl ..
发布时间:2020-04-25 11:18:43 AI人工智能

批量归一化(BN)后使用泄漏ReLu是否有用

在我的CNN网络中,我正在使用BN层之后的Leaky ReLu. Leaky ReLu通过为负值添加f(y)= ay解决垂死的ReLu问题. BN引入了零均值和单位方差.那么BN是否会删除负数部分,即这会将所有值转换为0到1的小数位数吗?基于此,将选择Leaky ReLu.因为如果BN移除负部分,则使用泄漏的relu将与relu相同.我正在使用keras. 解决方案 BN层尝试通过减去对输 ..
发布时间:2020-04-25 11:05:51 AI人工智能

我正在使用GridSearchCV训练Ann机器学习模型,并在gridSearchCV中陷入IndexError问题

我的模型开始训练,执行一段时间后出现错误:- IndexError:索引37超出了尺寸为37的轴0的边界 对于我的模型,它可以正确执行,而无需使用带有固定参数的gridsearchCV 这是我的代码 from keras.wrappers.scikit_learn import KerasClassifier from sklearn.model_selectio ..
发布时间:2020-04-25 11:05:37 AI人工智能