在k-均值聚类中，如何设置每个簇的最小观测数？ [英] How to set a minimum number of observations per clusters in k-means clustering?

查看：33 发布时间：2022/3/2 10:26:36 pandas machine-learning scikit-learn data-science k-means

本文介绍了在k-均值聚类中，如何设置每个簇的最小观测数？的处理方法，对大家解决问题具有一定的参考价值，需要的朋友们下面随着小编来一起学习吧！

问题描述

我正在尝试根据用户行为对一些产品进行集群。我最后看到的是具有非常不同观测数量的星团。

我已检查k-Means群集参数，但找不到控制每个群集的最小(或最大)观察数的参数。

例如，此处显示了观察值数量在不同群集之间的分布方式。

cluster_id   num_observations
0   6
1   4
2   1
3   3
4   29
5   5

有关于如何处理此问题的帮助吗？是否有其他群集算法可以处理此问题？

推荐答案

适用于仍在寻找答案的人。我找到了处理此类问题的good module或this module

使用pip install size-constrained-clustering或pip install git+https://github.com/jingw2/size_constrained_clustering.git并使用MinMaxKMeansMinCostFlow，您可以在其中选择size_min和size_max

n_samples = 2000
n_clusters = 3
X = np.random.rand(n_samples, 2)
model = minmax.MinMaxKMeansMinCostFlow(n_clusters, size_min=400,   size_max=800)
model.fit(X)
centers = model.cluster_centers_
labels = model.labels_

这篇关于在k-均值聚类中，如何设置每个簇的最小观测数？的文章就介绍到这了，希望我们推荐的答案对大家有所帮助，也希望大家多多支持IT屋！

查看全文

在k-均值聚类中，如何设置每个簇的最小观测数？ [英] How to set a minimum number of observations per clusters in k-means clustering?

问题描述

推荐答案

相关文章

AI人工智能最新文章

热门教程

热门工具

登录关闭

在k-均值聚类中，如何设置每个簇的最小观测数？ [英] How to set a minimum number of observations per clusters in k-means clustering?

问题描述

推荐答案

相关文章

AI人工智能最新文章

热门教程

热门工具

登录 关闭

登录关闭