聚类分析的目的
聚类分析的目的:使类间对象的同质性最大化。
1、聚类分析指将物理或抽象对象的集合分组为由类似的对象组成的多个类的分析过程。
2、它是一种重要的人类行为。
3、聚类分析的目标就是在相似的基础上收集数据来分类。
4、聚类源于很多领域,包括数学,计算机科学,统计学,生物学和经济学。
5、在不同的应用领域,很多聚类技术都得到了发展,这些技术方法被用作描述数据,衡量不同数据源间的相似性,以及把数据源分类到不同的簇中。
区别:
聚类与分类的不同在于,聚类所要求划分的类是未知的。
聚类是将数据分类到不同的类或者簇这样的一个过程,所以同一个簇中的对象有很大的相似性,而不同簇间的对象有很大的相异性。
从统计学的观点看,聚类分析是通过数据建模简化数据的一种方法。传统的统计聚类分析方法包括系统聚类法、分解法、加入法、动态聚类法、有序样品聚类、有重叠聚类和模糊聚类等。采用k-均值、k-中心点等算法的聚类分析工具已被加入到许多著名的统计分析软件包中,如SPSS、SAS等。
从机器学习的角度讲,簇相当于隐藏模式。聚类是搜索簇的无监督学习过程。与分类不同,无监督学习不依赖预先定义的类或带类标记的训练实例,需要由聚类学习算法自动确定标记,而分类学习的实例或数据对象有类别标记。聚类是观察式学习,而不是示例式的学习。
2023-08-15 广告
2023-09-07 · 百度认证:SPSSAU官方账号,优质教育领域创作者