评价指标

发布时间：2023年12月30日

更新时间：2023年12月30日

运用划分式聚类的往年获奖论文

官方评析:MCM/ICM:2023:2311717

官方评析:MCM/ICM:2023:2300348

官方评析:MCM/ICM:2023:2318036

官方评析:MCM/ICM:2023:2314151

官方评析:MCM/ICM:2023:2307946

官方评析:MCM/ICM:2023:2309397

官方评析:MCM/ICM:2023:2301192

官方评析:MCM/ICM:2023:2315018

官方评析:MCM/ICM:2023:2320131

官方评析:MCM/ICM:2023:2314817

官方评析:MCM/ICM:2023:2314354

轮廓系数: 轮廓系数结合了聚类的凝聚度和分离度。对于每个样本，轮廓系数是样本与其自身簇中其他点的平均距离和样本与最近的非自身簇的平均距离之差与它们的最大值的比值。轮廓系数的取值范围是[-1, 1]，其中接近 1 的值表示样本聚类效果好，接近 -1 的值表示样本聚类效果差。
聚类内误差平方和: 又称为惯性，是 k-means 算法最直接的优化目标，即每个点到其簇中心的距离的平方和。此值越小，说明聚类内部的点越紧密。
Davies-Bouldin 指数: DBI 是一种基于簇内相似度和簇间不相似度的比率的评价指标。一个较低的 DBI 值通常表示一个模型有较好的聚类效果。
Calinski-Harabaz 指数: CHI 它是簇间离散度和簇内离散度的比值。较高的 CHI 值通常意味着簇之间分得更开，簇内更紧密，因此聚类效果更好。

参考代码：

python
from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score, davies_bouldin_score, calinski_harabasz_score

# 创建模拟数据
X, y = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)

# 应用 k-means 聚类
kmeans = KMeans(n_clusters=4, random_state=0).fit(X)

# 预测聚类标签
labels = kmeans.labels_

# 计算轮廓系数
silhouette_avg = silhouette_score(X, labels)
print(f"轮廓系数: {silhouette_avg}")

# 计算 WCSS
wcss = kmeans.inertia_
print(f"聚类内误差平方和（WCSS）: {wcss}")

# 计算 Davies-Bouldin 指数
dbi = davies_bouldin_score(X, labels)
print(f"Davies-Bouldin 指数: {dbi}")

# 计算 Calinski-Harabasz 指数
chi = calinski_harabasz_score(X, labels)
print(f"Calinski-Harabasz 指数: {chi}")
from sklearn.datasets import make_blobs
from sklearn.cluster import KMeans
from sklearn.metrics import silhouette_score, davies_bouldin_score, calinski_harabasz_score

# 创建模拟数据
X, y = make_blobs(n_samples=300, centers=4, cluster_std=0.60, random_state=0)

# 应用 k-means 聚类
kmeans = KMeans(n_clusters=4, random_state=0).fit(X)

# 预测聚类标签
labels = kmeans.labels_

# 计算轮廓系数
silhouette_avg = silhouette_score(X, labels)
print(f"轮廓系数: {silhouette_avg}")

# 计算 WCSS
wcss = kmeans.inertia_
print(f"聚类内误差平方和（WCSS）: {wcss}")

# 计算 Davies-Bouldin 指数
dbi = davies_bouldin_score(X, labels)
print(f"Davies-Bouldin 指数: {dbi}")

# 计算 Calinski-Harabasz 指数
chi = calinski_harabasz_score(X, labels)
print(f"Calinski-Harabasz 指数: {chi}")

输出结果：

none

轮廓系数: 0.6819938690643478
聚类内误差平方和（WCSS）: 212.00599621083472
Davies-Bouldin 指数: 0.43756400782378396
Calinski-Harabasz 指数: 1210.0899142587816

评价指标

运用 划分式聚类 的往年获奖论文

运用划分式聚类的往年获奖论文