系统聚类和k均值聚类区别和联系
1个回答
关注
展开全部
你好k_means均值聚类,采用欧式距离做为相似度指标,将相似度高的数据对象划分为一类,通过反复迭代计算新质心,并且样本观测所属的类会不断的调整,使得新质心与所有数据对象的平方误差总和最小的一种迭代型快速聚类算法,变量类型为连续型变量,需要主动设定分类数。
(2)系统聚类,又称层次聚类和谱系分析,通过度量数据之间的距离远近,将数据分类,变量类型含有连续变量和分类变量,可以像k-means算法一般,指定类别个数或限定类别个数范围。
咨询记录 · 回答于2021-10-31
系统聚类和k均值聚类区别和联系
你好k_means均值聚类,采用欧式距离做为相似度指标,将相似度高的数据对象划分为一类,通过反复迭代计算新质心,并且样本观测所属的类会不断的调整,使得新质心与所有数据对象的平方误差总和最小的一种迭代型快速聚类算法,变量类型为连续型变量,需要主动设定分类数。(2)系统聚类,又称层次聚类和谱系分析,通过度量数据之间的距离远近,将数据分类,变量类型含有连续变量和分类变量,可以像k-means算法一般,指定类别个数或限定类别个数范围。
你这是概念吧,我要的是区别与联系
系统聚类法适于二维有序样品聚类的样品个数比较均匀。K均值聚类法适用于快速高效,特别是大量数据时使用。两者区别如下:一、指代不同1、K均值聚类法:是一种迭代求解的聚类分析算法。2、系统聚类法:又叫分层聚类法,聚类分析的一种方法。二、步骤不同1、K均值聚类法:步骤是随机选取K个对象作为初始的聚类中心,然后计算每个对象与各个种子2、系统聚类法:开始时把每个样品作为一类,然后把最靠近的样品(即距离最小的群品)三、目的不同1、K均值聚类法:终止条件可以是没有(或最小数目)对象被重新分配给不同的聚类,2、系统聚类法:是以距离为相似统计量时,确定新类与其他各类之间距离的方法,如最短距离法、最长距离法、中间距离法、重心法、群平均法、离差平方和法、欧氏距离等。
均值法和系统聚类法比较: 联系就是二者都是以距离的远近亲疏为标准进行聚类的 不同——系统聚类对不同的类数产生一系列的聚类果, 而K—均值法只能产生指定K类聚类结果; 对变量的要求不同。 使用K均值聚类时注意: 1. 要求事先知道将样品分为多少类.类数的确定,离不开实践经验的积累;有时也可以借助系统聚类法以一部分样品为对象进行聚类,其结果作为K—均值法确定类数的参考。 2.只能对样品进行聚类,不能对变量进行聚类。 3.所使用的变量必须是连续型变量 2 K—均值聚类法的适应范围
已赞过
评论
收起
你对这个回答的评价是?