发布时间:2025-05-20 11: 37: 00
品牌型号:联想GeekPro 2020
系统:Windows 10 64位专业版
软件版本:GraphPad 10.3.0
聚类分析,其实就是将大量的样本简化为少数类别的方法。“聚类”两字也说明了这个分析方法是将数据聚集起来,然后归类的方法。什么地方会用到聚类分析呢?比较常用的是人群细分、社群分析、客户分类等,大多数跟群体分析有关。接下来,本文会给大家介绍怎么在图表中显示数据的聚类分析结果,GraphPad如何生成聚类热图的相关内容。
一、怎么在图表中显示数据的聚类分析结果
想要在图表中显示数据的聚类分析结果,一般要用到专业的数据分析软件,本文会以GraphPad为例,教大家具体怎么操作。GraphPad是一款专业的数据处理与图形制作软件,如果大家对图表的制作要求比较高,用GraphPad就对了,可以省掉很多格式化图表的时间。
1、在GraphPad进行聚类分析,要用到多变量数据表。我们只要在GraphPad的欢迎页面的左侧,选择“multiple variables”就可以了。
2、多变量数据表,顾名思义,就是包含多列变量的数据表。虽然与column数据表有点像,但可以做的分析不同,大家注意不要搞混。
3、创建好数据表后,导入已经准备好的数据。这里我们导入了四个变量的数据,分别是指标1、2、3、4变量,可以看到,多变量数据表单元格里面都是数字,没有字符标题。
4、完成数据的导入后,如图4所示,打开GraphPad顶部的分析菜单,然后依次选择聚类(clustering)-K均值聚类(K-means clustering)。
5、然后,GraphPad会跳转到“分析数据”的设置窗口,一般按照默认设置就可以了,不用调整选项,除非是要减少分析的变量。如果要减少的话,在右侧变量选项取消勾选就可以了。
6、在K均值聚类分析设置中,如图6所示,重点是要打开“结果(output)”选项卡,我们可以勾选一些额外的报告,比如聚类细节、标准化数据等。这样我们在看结果的时候,就可以多参考一下其他的数据。
6、在图表设置上,GraphPad的K均值聚类分析可输出肘部图(Elbow plot)、Silhouette图以及Gap图,三种图表都可以看聚类的数量。
7、下面我们简单看一下GraphPad K均值聚类的分析结果。对于本例数据,聚类为3个类别时,已解释方差的百分比(percent of explained variation)较大(49.49%),说明聚类分析的效果比较好。
8、聚类分析的肘部图主要是看坡度的平缓处,因为平缓处的WCSS(总聚类内平方和)的数值减少幅度变得很小,说明这个点后已经不能显著减少误差。这样我们就能在这个点找到最佳聚类数量,本例数据是在类别数量=3时,WCSS到达平缓处。
二、GraphPad如何生成聚类热图
上述我们主要介绍的是GraphPad的K均值聚类。如果要生成聚类热图,要使用GraphPad的分层聚类方法。
1、在GraphPad顶部的分析菜单中,我们可以在聚类分析大类中找到“分层聚类(Hierarchical clustering)”。
2、同样地,GraphPad会跳转到分析数据窗口,保持默认设置就可以了。
3、然后,在分层聚类设置面板中,我们要打开“图表”选项卡。如图12所示,在分层聚类的图表选项中,可以找到热图(Heatmap)的选项,勾选这个选项,我们就能在输出结果里面得到聚类热图。
4、GraphPad生成的聚类热图如图13所示,颜色越相近的样本,越能归属到同一个类别,比如第二层到第五层的颜色都比较深,可以将它们归为一类。而从第六层开始,颜色都比较浅,可以将第六层开始到最后都归为一类。
三、小结
以上就是关于怎么在图表中显示数据的聚类分析结果,GraphPad如何生成聚类热图的相关内容。GraphPad的聚类分析结果很丰富,如果您要画一些图表来展示数据,GraphPad可以输出肘部图、Silhouette图、Gap图、热图等图表,可以省掉很多画图的时间。而且GraphPad的图表都比较美观,不用花很多时间美化,用起来很方便。
作者:泽洋
展开阅读全文
︾