silhouette - IT屋-程序员软件开发技术分享社区

如何在 sklearn 库的 k 均值聚类中使用轮廓分数?

我想在我的脚本中使用轮廓分数，从 sklearn 自动计算 k-means 聚类中的聚类数. 将 numpy 导入为 np将熊猫导入为 pd导入 csv从 sklearn.cluster 导入 KMeans从 sklearn.metrics 导入剪影_分数文件名 = "CSV_BIG.csv"# 使用 Pandas 库读取 CSV 文件.path_dir = ".\\"dataframe = p ..

发布时间：2021-12-25 14:55:45 python-2.7 machine-learning scikit-learn k-means silhouette AI人工智能

使用剪影 4.0 播放 2.5 - 凭据提供程序

我正在尝试使用Silhouette 4.0为用户/密码身份验证编写带有Play 2.5的示例应用程序. 源代码位于:https://github.com/pariksheet/dribble 我被困在环境对象中设置 requestProvider 环境[JWTEnv](身份服务，验证器服务，序列()，事件总线) 由于我无法找出解决方案，所以我在所有控制器类中注入了 Credenti ..

发布时间：2021-06-18 18:48:37 scala playframework silhouette 其他开发

轮廓分数如何为负?

如果我们有一些数据点: 例如，我们使用k均值进行细分；产生的段是否不是每个点都最接近其各自簇的质心?如果是这样，那么当轮廓分数比较ai(到集群内点的平均距离)与bi(到集群外点的平均距离)进行比较时，怎么可能会出现分数为负或bi小于ai的情况呢?? 我可以看到，对于不同的分类算法，某些更复杂的分类算法可能会有所不同，或者某些点分配不正确.但是，这对于k均值是如何发生的? 解决方案 ..

发布时间：2021-05-28 19:32:42 k-means silhouette 其他开发

ValueError:具有多个元素的数组的真值不明确.使用a.any()或a.all():轮廓表现算法

我在python中实现了kmeans算法，并试图计算剪影的性能各种k值的簇的集合. 这是数据集中一小部分的几个变量. def avgdist(pt, clust): dists = [] for elem in clust: dists.append(np.linalg.norm(pt-elem)) return np.mean(dists) def ..

发布时间：2021-02-15 19:03:30 python python-3.x numpy k-means silhouette Python

如何在fviz_silhouette中将颜色更改为除簇号以外的变量

我正在使用 R 中的软件包 factoextra 生成轮廓图.当前，轮廓通过聚类自动为图形着色.我想用另一个已定义为x的变量Site进行着色.我已经尝试过将其填充和颜色更改为站点变量，但是似乎没有任何效果.我也尝试使用scale_color_manual和scale_fill_discrete.我认为关键在scale_fill_discrete中，因为另一个用户的源代码指出了 mapping ..

发布时间：2020-11-14 00:16:20 r ggplot2 cluster-computing silhouette 其他开发

如何在sklearn库的k均值聚类中使用轮廓分数?

我想在脚本中使用轮廓分数，以自动计算来自sklearn的k均值聚类中的聚类数. import numpy as np import pandas as pd import csv from sklearn.cluster import KMeans from sklearn.metrics import silhouette_score filename = "CSV_BIG.csv" ..

发布时间：2020-04-26 10:19:42 python-2.7 machine-learning scikit-learn k-means silhouette AI人工智能

silhouette相关内容