我们一般使用哪些指标判断聚类结果的优劣?

我们一般使用哪些指标判断聚类结果的优劣... 我们一般使用哪些指标判断聚类结果的优劣 展开
 我来答
3D视觉开发者社区
2022-05-12 · 超过18用户采纳过TA的回答
知道答主
回答量:110
采纳率:50%
帮助的人:8.7万
展开全部
有参考标准的指标主要有:

1、Jaccard系数(Jaccard Coefficient, JC)
2、FM指数(Fowlkes and Mallows Index, FMI)
3、Rand指数(Rand Index, RI)
4、F值(F-measure)
上述性能度量的结果值均在[0,1]区间,值越大越好,值越大表明聚类结果和参考模型,直接的聚类结果越吻合,聚类结果就相对越好。
5、兰德系数(Rand index,RI)需要给定实际类别信息C,假设K是聚类结果,RI取值范围为[0,1],值越大意味着聚类结果与真实情况越吻合。
6、调整兰德系数(Adjusted rand index)对于随机结果,RI并不能保证分数接近零。所以ARI取值范围为[-1,1],值越大意味着聚类结果与真实情况越吻合。从广义的角度来讲,ARI衡量的是两个数据分布的吻合程度。

无监督的,无需基准数据集,不需要借助于外部参考模型指标有:

1、紧密度(Compactness):每个聚类簇中的样本点到聚类中心的平均距离。对应聚类结果,需要使用所有簇的紧密度的平均值来衡量聚类算法和聚类各参数选取的优劣。紧密度越小,表示簇内的样本点月集中,样本点之间聚类越短,也就是说簇内相似度越高。
2、分割度(Seperation):是个簇的簇心之间的平均距离。分割度值越大说明簇间间隔越远,分类效果越好,即簇间相似度越低。
3、戴维森堡丁指数(Davies-bouldin Index,DBI):该指标用来衡量任意两个簇的簇内距离之后与簇间距离之比。该指标越小表示簇内距离越小,簇内相似度越高,簇间距离越大,簇间相似度低。
4、邓恩指数(Dunn Validity Index,DVI):任意两个簇的样本点的最短距离与任意簇中样本点的最大距离之商。该值越大,聚类效果越好。
5、轮廓系数 (Silhouette Coefficient):对于一个样本集合,它的轮廓系数是所有样本轮廓系数的平均值。轮廓系数的取值范围是[-1,1],同类别样本距离越相近不同类别样本距离越远,分数越高。

若帮助到您,求采纳~
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式