博文

SPSS中的聚类分析

已有 15034 次阅读 2010-9-25 14:45 |个人分类:SPSS学习|系统分类:科研笔记| SPSS, 聚类

题外话：聚类理论都比我懂，在这只能做做笔记

1. TwoStep Cluster Analysis

刚接触它时莫名其妙，不明白为什么会有这一项。粗略了解后，感觉其主要特点一是可计算出最佳聚类个数，二是可处理分类变量（Categorical Variables）与连续性变量（Continuous Variables）。计算步骤包括：1）构建聚类特征数（Cluster Features Tree）；2）层次聚类。自动确定最佳聚类个数的方法是Schwarz’s Bayesian Criterion（BIC）或Akaike’s Information Criterion（AIC）。这俩准则是啥，知道的朋友记得告诉我。

在结果输出的“Auto-Clustering”表中（以BIC为例），第2列是BIC，其值最小时，一般认为聚类结果最理想；第3列是BIC变化，反映合并前后两种聚类结果的BIC变化情况，绝对值越大，聚类结果越理想；第4列是BIC变化率，同样反映合并前后的变化；第5列是最小距离变化率，一般认为值越大越理想。需要说明的是，虽然有4个统计指标，但不是根据某一个指标来确定聚类个数，而是综合考虑的结果。

2．数据标准化

Hierarchical Cluster和TwoStep Cluster都能在分析中对数据进行标准化处理，K-Means Cluster则必须事先完成。

3．方差分析表

ANOVA表中的Sig.小于0.05，表明该指标在各类间存在显著性差异。指标的F值越大，表明该指标在聚类分析中越重要。

转载本文请联系原作者获取授权，同时请注明本文来自赖院根科学网博客。
链接地址：https://blog.sciencenet.cn/blog-422720-366766.html

上一篇：SPSS中的参数检验（二）
下一篇：图情档SCI/SSCI期刊（2010）

收藏 IP: .*| 热度|

当前推荐数：6 推荐人：高建国 陈筝 化柏林 丁甜 田灿荣 宋敦江

发表评论评论 (1 个评论)

数据加载中...

返回顶部

博文发布时间已经超过87600小时，评论已关闭。

赖院根

扫一扫，分享此博文

莫问收获，但务耕耘分享 http://blog.sciencenet.cn/u/xiezilai 中国科学技术信息研究所

博文

SPSS中的聚类分析

当前推荐数：6 推荐人：高建国 陈筝 化柏林 丁甜 田灿荣 宋敦江

发表评论评论 (1 个评论)

赖院根

全部作者的其他最新博文

全部精选博文导读

相关博文

莫问收获，但务耕耘分享 http://blog.sciencenet.cn/u/xiezilai 中国科学技术信息研究所

博文

SPSS中的聚类分析

当前推荐数：6 推荐人： 高建国 陈筝 化柏林 丁甜 田灿荣 宋敦江

发表评论 评论 (1 个评论)

赖院根

全部作者的其他最新博文

全部精选博文导读

相关博文

当前推荐数：6 推荐人：高建国陈筝化柏林丁甜田灿荣宋敦江

发表评论评论 (1 个评论)