如何利用R软件进行聚类分析?

 我来答
猪八戒网
2023-06-06 · 百度认证:重庆猪八戒网络有限公司官方账号
猪八戒网
猪八戒网(zbj.com)创建于2006年,现已形成猪八戒网、天蓬网和线下八戒工场的“双平台+一社区”服务模式,是中国领先的人才共享平台。
向TA提问
展开全部

1、打开R软件,输入数据,生成距离结构。这里设样本数据为1,2,3,7,8,9,15。输入代码:x=c(1,2,3,7,8,9,15);dim(x)=c(7,1);d=dist(x)其中x是生成向量,dim表示定义向量的维数,dist表示生成距离矩阵。

2、生成系统聚类。输入代码:hc1=hclust(d,"single");hc2=hclust(d,"complete");hc3=hclust(d,"median");hc4=hclust(d,"average");其中hclust表示系统聚类计算函数,single、complete、median、average分别表示最短距离法、最长距离法、中间距离法、类平均法这四类计算方法。

3、绘制出聚类图形。利用plot函数绘制出最短距离法计算的聚类图。代码:plot(hc1)

4、为了方便比较各聚类方法的效果,可以将不同方法的图绘制在一张图上。输入代码:opar=par(mfrow=c(2,2))plot(hc1,hang=-1);plot(hc2,hang=-1);plot(hc3,hang=-1);plot(hc4,hang=-1);par(opar)其中par为绘图参数函数。mfrow为设置小图数量的参数,mfrow=c(2,2)表示把图按行排列成2×2个小图。画出的图形见下图。

5、从图中可以看出聚类的结果为第1,2,3个值为一类,4,5,6个值为一类,第七个值为一类。共分为三类。如果想自动设置分类个数,可以利用函数rect.hclust。plot(hc1);re=rect.hclust(hc1,k=2)表示将聚类图分为两类。

光点科技
2023-08-15 广告
通常情况下,我们会按照结构模型把系统产生的数据分为三种类型:结构化数据、半结构化数据和非结构化数据。结构化数据,即行数据,是存储在数据库里,可以用二维表结构来逻辑表达实现的数据。最常见的就是数字数据和文本数据,它们可以某种标准格式存在于文件... 点击进入详情页
本回答由光点科技提供
推荐律师服务: 若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询

为你推荐:

下载百度知道APP,抢鲜体验
使用百度知道APP,立即抢鲜体验。你的手机镜头里或许有别人想知道的答案。
扫描二维码下载
×

类别

我们会通过消息、邮箱等方式尽快将举报结果通知您。

说明

0/200

提交
取消

辅 助

模 式