如何在SPSS中进行系统的聚类分析?

如何进行系统的聚类分析?

如果是基于变量(标题)进行聚类,此时就要使用层次聚类(系统聚类),结合聚类树形图进行综合判断分析,得出科学的分析结果。例如,目前有8名裁判对300名球员进行评分,试图对这8名裁判进行聚类,找出裁判的得分偏好风格类别。这时候就需要层次聚类了。

在系统集群中有几点需要特别注意:

1:仅对定量数据进行系统聚类;

2.如果数据的单位差异较大,可以先对数据进行标准化,然后对标准化后的数据进行系统聚类。

3.因为都是定量数据,所以原则上在系统聚类中要用皮尔逊相关系数来度量距离。相关系数值越大,表示越近,相关系数值越小,表示越远。默认情况下,SPSSAU使用皮尔逊相关系数来表示距离。

4.SPSS AU使用组平均距离法对系统进行聚类。一般来说,先将相关性最强的两个项目聚类成一类(第一个合并聚类),然后找到与“合并聚类”相关性最强的第三个项目,聚类成第二个合并聚类,接着是第三个合并聚类,依次迭代这个过程,直到结束。

目前有8名裁判给300选手打分,最低分1,最高分10;希望将8个裁判聚类,以识别裁判的风格类型。有***8个裁判**有8列数据***有300行。因为分数都是从1到10,而且八列数据的单位都是一样的,所以在分析之前不需要对数据进行标准化(当然标准化是没有问题的)。

本例中,* * *涉及8个标题,SPSSAU操作截图如下。

默认情况下,SPSSAU将分为3个类别,并显示表格结果。如果想要更多的类别,可以自己设置。

SPSSAU输出结果

SPSSAU会先输出聚类项目的基本描述,然后输出每个项目的聚类类别属性;并输出一个树形视图,如下所示:

上表显示了总共***8个分析项目(即8个裁判数据)的基本信息,包括均值、最大值或最小值、中位数等。,从而对基础数据有一个大致的了解。整体来看,8位裁判的平均分都在8分以上。

总* * *聚类分为三类,以及具体分析项目的对应关系。如上表所示,从上表可以看出:裁判8单独作为一个类别;裁判5、3、7分在一起;和裁判1,6,2,4为一类。

聚类类别与分析项目的对应关系可以在上表中得到,更多信息可以通过查看聚类树形图得到。至于集群类别应该叫什么,这个需要根据相应的相关情况分别命名。

上图是聚类树图,用图解的方法展示了聚类的具体过程;最上面一行的数字只是一个刻度单位,代表相对距离;一个节点代表一个聚焦过程。

在树形图的解读中,建议单独画一条竖线,然后分成几类,以及每类与分析项目的对应关系。比如上图,红色竖线最终会分裂成三类;第1类对应裁判8;第二类对应裁判5、3、7;第三类对应裁判1,6,2,4。