数据挖掘对聚类的数据要求是什么?

 我来答
yang_zs
2012-06-04
知道答主
回答量:50
采纳率:0%
帮助的人:18.4万
展开全部
1. 可扩展性(Scalability)
大多数来自于机器学习和统计学领域的聚类算法在处理数百条数据时能表现出高效率
2. 处理不同数据类型的能力
数字型;二元类型,分类型/标称型,序数型,比例标度型等等
3. 发现任意形状的能力
基于距离的聚类算法往往发现的是球形的聚类,其实现实的聚类是任意形状的
4. 用于决定输入参数的领域知识最小化
对于高维数据,参数很难决定,聚类的质量也很难控制
5. 处理噪声数据的能力
对空缺值、孤立点、数据噪声不敏感
6. 对于输入数据的顺序不敏感
同一个数据集合,以不同的次序提交给同一个算法,应该产生相似的结果
7. 高维度
高维度的数据往往比较稀松,而且高度倾斜
8. 基于约束的聚类
找到既满足约束条件,又具有良好聚类特性的数据分组
9. 可解释性和可用性
聚类要和特定的语义解释和应用相联系

相异度矩阵:存储n个对象两两之间的近似性,也叫单模矩阵,行和列代表相同的实体
yanxinfadata
2012-06-01
知道答主
回答量:28
采纳率:0%
帮助的人:17万
展开全部
这个要看具体的聚类算法,不同的算法对数据的要求是不同的。例如对K-means算法要求:
数据类型,不适用分类属性
样本分布:不适合非凸形状,
数据分布:噪声和离群点敏感

对聚类倒是有一定的要求,对聚类的典型要求如下:
可伸缩性
处理不同类型属性的能力
发现任意形状的聚类
用于决定输入参数的领域知识最小化
处理噪声数据的能力
已赞过 已踩过<
你对这个回答的评价是?
评论 收起
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式