k-means相关内容

如何设置Spark Kmeans初始中心

我正在使用Spark ML运行Kmeans.我有大量数据和三个现有中心,例如,三个中心是:[1.0,1.0,1.0],[5.0,5.0,5.0],[9.0,9.0,9.0]. 因此,我如何指示Kmeans中心是上述三个向量. 我看到Kmean对象具有种子参数,但是种子参数是长类型而不是数组.因此,如何告诉Spark Kmeans仅使用现有的中心进行聚类. 或者说,我不明白种子在Spark K ..

变异/小标题中的自定义功能

我正在遵循教程,我正在尝试将此部分应用于我的数据/问题 kclusts % mutate( kclust = map(k, ~kmeans(points, .x)), tidied = map(kclust, tidy), glanced = map(kclust, glance), augmented = map ..
发布时间:2020-04-26 10:24:42 其他开发

Scipy Kmeans退出并出现TypeError

在运行下面的代码时,我收到一个TypeError: scipy.cluster._vq.update_cluster_means中的“文件"_vq.pyx",第342行 TypeError:不支持float或double类型之外的其他类型" from PIL import Image import scipy, scipy.misc, scipy.cluster NUM_CLUSTE ..
发布时间:2020-04-26 10:24:33 Python

MATLAB-分类输出

我的程序使用K-means群集,该群集来自用户一定数量的群集.对于这个k = 4,但是我想稍后通过matlabs天真的贝叶斯分类器运行聚类信息. 是否有一种方法可以将集群拆分并馈入Matlab中的不同朴素分类器? 朴素贝叶斯: class = classify(test,training, target_class, 'diaglinear'); K均值: % ..
发布时间:2020-04-26 10:24:29 其他开发

使用Jaccard距离矩阵的Kmeans聚类

我正在尝试创建Jaccard距离矩阵并对其执行K-均值,以给出集群ID和集群中元素的ID.它的输入是twitter tweets.以下是代码,我不明白如何为kmeans使用文件中的初始种子. install.packages("rjson" ,dependencies=TRUE) library("rjson") install.packages("jsonlite" ,dependenci ..
发布时间:2020-04-26 10:24:26 其他开发

scikit-learn的k均值:预测方法实际上有什么作用?

当我使用scikit-learn的k-means实现时,我通常只调用fit()方法,这足以获取聚类中心和标签. predict()方法用于计算标签,甚至为方便起见也可以使用fit_predict()方法,但是如果我只能使用fit()获得标签,那么predict()方法的目的是什么? 正如@EdChum建议的那样, 解决方案 predict可以用于看不见的数据.当k均值用于半监督学习中的特征提 ..
发布时间:2020-04-26 10:24:22 其他开发

k-均值使用从minhash生成的签名矩阵

我在文档及其带状疱疹上使用了minhash来从这些文档生成签名矩阵.我已经验证了签名矩阵可以很好地比较已知的相似文档(例如,关于同一运动队的两篇文章或关于同一世界事件的两篇文章)的jaccard距离,从而可以正确读取读数. 我的问题是:使用此签名矩阵执行k均值聚类是否有意义? 我尝试使用文档的签名向量,并在迭代kmeans算法中计算这些向量的欧式距离,而对于簇我总是一无所获.我知道应该 ..
发布时间:2020-04-26 10:24:20 Python

kmeans和kmeans2在scipy之间有什么区别?

我是机器学习的新手,我想知道kmeans和kmeans2在scipy中的区别.根据文档,他们两个都使用"k-means"算法,但是如何选择它们呢? 解决方案 根据文档,kmeans2似乎是标准的k均值算法,一直运行到收敛到局部最优值为止-并允许您更改种子初始化. kmeans函数将根据缺乏更改而提前终止,因此它甚至可能无法达到局部最优值.此外,其目的是生成用于将特征向量映射到的码本. ..
发布时间:2020-04-26 10:24:12 AI人工智能

在R中的kmeans的每次迭代中获取每个观测的坐标

我想在R中构建kmeans聚类算法的动画.该动画将显示数据集中按2(或3)维绘制的每个观测值(行),然后将它们移动到它们的集群中,如下所示:每次迭代都会滴答作响. 为此,我将需要在每次迭代时访问观测值的坐标.我可以在kmeans包中的哪个位置访问这些文件? 谢谢 解决方案 我不认为kmeans()输出此类跟踪信息.最好的办法可能是重新运行kmeans()多次,以保留群集中心. ..
发布时间:2020-04-26 10:24:08 其他开发

关于“优化K-均值算法"的更多问题得到解决.

我想实现一篇论文,标题为"K-Means聚类算法的优化版本".本文在此链接中: https://fedcsis.org/proceedings/2014/pliks /258.pdf . 本文不明显.我在stackoverflow中看到@Vpp Man在问这个问题(优化K-means算法 ),但由于对此我还有其他疑问,因此我创建了新的问题页面. 我的问题: 1)算法2是否充满算法,或者 ..
发布时间:2020-04-26 10:24:05 AI人工智能

加入邻居簇质心Matlab

我已经使用K-means使用此[X,C] = kmeans(XX, 8]将数据聚类为8个不同的聚类,这意味着我有8个质心,其位置存储在C“在X Y Z下显示为列的示例"中.我想将8个质心连接在一起,其中仅彼此靠近的群集的质心“彼此之间具有边界",而彼此不靠近的群集的质心未连接.因此,如果有人可以提出建议? C= -0.214560757496055 0.2082430299 ..
发布时间:2020-04-26 10:24:01 其他开发