SPSS实操4:聚类分析
1个回答
展开全部
我们有时需要对一波总体样本进行分群,从而更好地了解群体之间的差异,通过聚类分析可以帮助我们解决这个问题。聚类分析在市场细分、人群细分等方面可以给我们很多启发。
聚类分析在SPSS中分为系统聚类、K聚类及两步聚类。
从区别上看,系统聚类、K聚类主要针对的是计量资料,而两步具备可同时对计量资料、计数资料进行处理。
尽管在日常工作涉及的问卷中,计数资料涉及得较少,但从结果解读方面,仍然是两步聚类的解读更为直观。
以两步聚类为例,我们来看一个案例:
经过本篇文章学习,您能够对问卷数据做以下分析:
①对总样本进行聚类
②筛选满足不同条件的个案进行进一步分析(选择个案)
TIPS:在两步聚类前,一定要先清洗数据,因跳转题而出现的-3值,要全部清除掉之后再进行聚类操作
1.分析-分类-两步聚类
2.将可能影响到人群细分结果的变量选入分类变量中
连续变量在本次问卷题目中未涉及,因此不选
这一步的变量选择在不确定的情况下,可能需要多次聚类验证,一定要选择聚类效果最佳的那几个变量
这里已经根据最佳效果选择好了相关变量
3.选项-操作默认
若涉及到连续变量,在【要标准化的变量】中,将出现连续变量
这里未涉及连续变量,因此这里未显示任何变量
4.输出
勾选上方的图表和表格、创建聚类成员变量
5.确定
6.结果解读
首先会出现一个简单的图,先来看一下这个图
显示我们输入了8个相关变量,聚类为5类
我们本次预测质量处在【良好】区间(这一步可多试几个变量,选择预测质量最好的那次即可)
双击这张图,会出现2个视图框
左侧还是刚刚的图,右侧则出现了本次5种聚类在总样本的占比情况
请注意,现在左侧视图默认在【模型概要】
我们现在选择【聚类】,会根据预测变量重要性出现一张渐变颜色的表格
逐一选择5个聚类所在的列,右侧选择【单元分布】,会显示聚类比较的结果
回到数据视图中,原表格中最后一新增了一列TSC,显示的数值则是根据本次聚类,每个人对应在哪个分类的结果。
7.想要详细了解各个细分人群在其他变量上的特征,我们根据【选择个案】进行具体分析
数据-选择个案
如果条件满足(先以第1类举例)
TSC列中的数据为1,我们会将第1类人群全部筛选出来,可以针对这个人群做更为具体的分析
点击继续,点击确定
分析具体的人群特点,可以通过描述【描述统计】得到
将这个过程重复5遍,我们就可以知道每个人群的人群特点分别是怎么样的,再对这些细分人群进行命名,就实现了对一波样本进行人群细分的操作。
聚类分析在SPSS中分为系统聚类、K聚类及两步聚类。
从区别上看,系统聚类、K聚类主要针对的是计量资料,而两步具备可同时对计量资料、计数资料进行处理。
尽管在日常工作涉及的问卷中,计数资料涉及得较少,但从结果解读方面,仍然是两步聚类的解读更为直观。
以两步聚类为例,我们来看一个案例:
经过本篇文章学习,您能够对问卷数据做以下分析:
①对总样本进行聚类
②筛选满足不同条件的个案进行进一步分析(选择个案)
TIPS:在两步聚类前,一定要先清洗数据,因跳转题而出现的-3值,要全部清除掉之后再进行聚类操作
1.分析-分类-两步聚类
2.将可能影响到人群细分结果的变量选入分类变量中
连续变量在本次问卷题目中未涉及,因此不选
这一步的变量选择在不确定的情况下,可能需要多次聚类验证,一定要选择聚类效果最佳的那几个变量
这里已经根据最佳效果选择好了相关变量
3.选项-操作默认
若涉及到连续变量,在【要标准化的变量】中,将出现连续变量
这里未涉及连续变量,因此这里未显示任何变量
4.输出
勾选上方的图表和表格、创建聚类成员变量
5.确定
6.结果解读
首先会出现一个简单的图,先来看一下这个图
显示我们输入了8个相关变量,聚类为5类
我们本次预测质量处在【良好】区间(这一步可多试几个变量,选择预测质量最好的那次即可)
双击这张图,会出现2个视图框
左侧还是刚刚的图,右侧则出现了本次5种聚类在总样本的占比情况
请注意,现在左侧视图默认在【模型概要】
我们现在选择【聚类】,会根据预测变量重要性出现一张渐变颜色的表格
逐一选择5个聚类所在的列,右侧选择【单元分布】,会显示聚类比较的结果
回到数据视图中,原表格中最后一新增了一列TSC,显示的数值则是根据本次聚类,每个人对应在哪个分类的结果。
7.想要详细了解各个细分人群在其他变量上的特征,我们根据【选择个案】进行具体分析
数据-选择个案
如果条件满足(先以第1类举例)
TSC列中的数据为1,我们会将第1类人群全部筛选出来,可以针对这个人群做更为具体的分析
点击继续,点击确定
分析具体的人群特点,可以通过描述【描述统计】得到
将这个过程重复5遍,我们就可以知道每个人群的人群特点分别是怎么样的,再对这些细分人群进行命名,就实现了对一波样本进行人群细分的操作。
已赞过
已踩过<
评论
收起
你对这个回答的评价是?
光点科技
2023-08-15 广告
2023-08-15 广告
通常情况下,我们会按照结构模型把系统产生的数据分为三种类型:结构化数据、半结构化数据和非结构化数据。结构化数据,即行数据,是存储在数据库里,可以用二维表结构来逻辑表达实现的数据。最常见的就是数字数据和文本数据,它们可以某种标准格式存在于文件...
点击进入详情页
本回答由光点科技提供
推荐律师服务:
若未解决您的问题,请您详细描述您的问题,通过百度律临进行免费专业咨询