例7.2聚类分析:聚类分析实例
1个回答
展开全部
例7.2 现有8个样品,每个样品由二个指标来刻划(数据如表所示),试利用聚类分析对这8个样品进行分类。 解:(1)构造距离阵
表-1 样本数据与距离计算表
采用欧氏距离计算,可得如下距离阵
G10G22.0G32.2G42.8
G56.3G65.0G75.8G88.5
G1
02.2
2.01.0
*
0
2.20
1.41.00
6.75.15.40G5G6G7G8
G9
D(0)
6.08.18.04.16.36.15.17.37.16.78.67.8G2
G3
G4
G10
(2)依最短距离聚类
i)先将每一个样品视为一个类,则有8个类: {G1};{G2};{G3};{G4};{G5};{G6};{G7};{G8}
ii)在D(0)中取最小非零元d(0)min=d43=d76=1.0,故可以合并得到两个新的类,即
G9={G3,G4}; G10={G6,G7} 从而由8类降为6类,它们是:
{G1};{G2};G9={G3,G4};{G5};G10={G6,G7};{G8} iii)构造新的距离阵
G10G22.0G92.2D(1)
G56.3G105.0G88.5
G1
02.06.04.16.7G2
*
0
8.00G
11
6.11.40
7.86.75.10G9G5G10G8
其中:(1)原类与类之间的距离保持不变;
(2)原类与新类、新类与新类的距离,按类与类之间的距离定义求,例如: d
19
d(G1,G9)Min{d13,d14}
Min{2.2,2.8}2.2
d29d(G2,G9)Min{d23,d24}Min{2.2,2.0}2.0
Min{Min(6.3,6.1),Min(7.3,7.1)}Min{6.1,7.1}6.1
d9,10d(G9,G10)Min{Min(d36,d46),Min(d37,d47)}
在D(1)中取最小非零元d(1)min=d10,5= 1.4,故可合并得到一个新的类,即
G11={ G5,G10}={ G5,G6,G7} 从而由6个类降为5个类,即
{G1};{G2};G9={G3,G4};G11={ G5,G6,G7};{G8} iv)继续上述过程,有
G10
G2*2.00G92.22.00
G115.04.16.10
G88.56.77.85.10
G1G2G9G11G8
G12
D(2)
在D(2)中取最小非零元d(2)min=d12=d29=2.0,故可合并得到一个新的类,即
{G1,G2}、{G9,G2}, 也即 G12={G1,G2,G9}={G1,G2,G3,G4} 从而由5个类降为3个类,即
G12={G1,G2,G3,G4};G11={ G5,G6,G7};{G8}
D(3)
G120*G13
G114.10
G86.75.10
G12G11G8
在D(3)中取最小非零元d(3)min=d12,11=4.1,故可得 G13={G11,G12}={ G1,G2,G3,G4,G5,G6,G7}
从而由3个类降为2个类,即
G13={G11,G12}={ G1,G2,G3,G4,G5,G6,G7};{G8}
D(4)
G130*G14G85.10
G13G8
在D(4)中取最小非零元d(3)min=d13,8=5.1,故可得 G14={G13,G8}={ G1,G2,G3,G4,G5,G6,G7,G8} 最终归为一类,聚类到此结束。 (3)画出聚类图 (a)冰柱形谱系图
聚类图7.2-1
(b)散点型谱系图
如果将8个样品在X1OX2平面上表示,则聚类的结果更为直观。
聚类图7.2-2
(4)分析与讨论
从分类的角度来看,分得太多,说明不了什么问题,分得太少,又过于笼统,为了恰当地进行分类,通常是根据实际问题的特征与需要,事先给定一个所谓的阈值T,当D(k)中所有非零元素都大于这个阈值T时,就可终止聚类过程,并由此确定具体的分类。
例如;取阈值T=2.5,则聚类到D(3)时,聚类就结束,这样8个样品可分为三类,即
{ G1,G2,G3,G4};{G5,G6,G7};{G8} 这种分类的合理性,可由聚类图7.2-2加以验证。
表-1 样本数据与距离计算表
采用欧氏距离计算,可得如下距离阵
G10G22.0G32.2G42.8
G56.3G65.0G75.8G88.5
G1
02.2
2.01.0
*
0
2.20
1.41.00
6.75.15.40G5G6G7G8
G9
D(0)
6.08.18.04.16.36.15.17.37.16.78.67.8G2
G3
G4
G10
(2)依最短距离聚类
i)先将每一个样品视为一个类,则有8个类: {G1};{G2};{G3};{G4};{G5};{G6};{G7};{G8}
ii)在D(0)中取最小非零元d(0)min=d43=d76=1.0,故可以合并得到两个新的类,即
G9={G3,G4}; G10={G6,G7} 从而由8类降为6类,它们是:
{G1};{G2};G9={G3,G4};{G5};G10={G6,G7};{G8} iii)构造新的距离阵
G10G22.0G92.2D(1)
G56.3G105.0G88.5
G1
02.06.04.16.7G2
*
0
8.00G
11
6.11.40
7.86.75.10G9G5G10G8
其中:(1)原类与类之间的距离保持不变;
(2)原类与新类、新类与新类的距离,按类与类之间的距离定义求,例如: d
19
d(G1,G9)Min{d13,d14}
Min{2.2,2.8}2.2
d29d(G2,G9)Min{d23,d24}Min{2.2,2.0}2.0
Min{Min(6.3,6.1),Min(7.3,7.1)}Min{6.1,7.1}6.1
d9,10d(G9,G10)Min{Min(d36,d46),Min(d37,d47)}
在D(1)中取最小非零元d(1)min=d10,5= 1.4,故可合并得到一个新的类,即
G11={ G5,G10}={ G5,G6,G7} 从而由6个类降为5个类,即
{G1};{G2};G9={G3,G4};G11={ G5,G6,G7};{G8} iv)继续上述过程,有
G10
G2*2.00G92.22.00
G115.04.16.10
G88.56.77.85.10
G1G2G9G11G8
G12
D(2)
在D(2)中取最小非零元d(2)min=d12=d29=2.0,故可合并得到一个新的类,即
{G1,G2}、{G9,G2}, 也即 G12={G1,G2,G9}={G1,G2,G3,G4} 从而由5个类降为3个类,即
G12={G1,G2,G3,G4};G11={ G5,G6,G7};{G8}
D(3)
G120*G13
G114.10
G86.75.10
G12G11G8
在D(3)中取最小非零元d(3)min=d12,11=4.1,故可得 G13={G11,G12}={ G1,G2,G3,G4,G5,G6,G7}
从而由3个类降为2个类,即
G13={G11,G12}={ G1,G2,G3,G4,G5,G6,G7};{G8}
D(4)
G130*G14G85.10
G13G8
在D(4)中取最小非零元d(3)min=d13,8=5.1,故可得 G14={G13,G8}={ G1,G2,G3,G4,G5,G6,G7,G8} 最终归为一类,聚类到此结束。 (3)画出聚类图 (a)冰柱形谱系图
聚类图7.2-1
(b)散点型谱系图
如果将8个样品在X1OX2平面上表示,则聚类的结果更为直观。
聚类图7.2-2
(4)分析与讨论
从分类的角度来看,分得太多,说明不了什么问题,分得太少,又过于笼统,为了恰当地进行分类,通常是根据实际问题的特征与需要,事先给定一个所谓的阈值T,当D(k)中所有非零元素都大于这个阈值T时,就可终止聚类过程,并由此确定具体的分类。
例如;取阈值T=2.5,则聚类到D(3)时,聚类就结束,这样8个样品可分为三类,即
{ G1,G2,G3,G4};{G5,G6,G7};{G8} 这种分类的合理性,可由聚类图7.2-2加以验证。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询