SPSS因子分析实例操作步骤
实验目的:
引入2003~2013年全国的农、林、牧、渔业,采矿业,制造 业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业7个产业的投资值作为变量,来研究其对全国总固定投资的影响。
实验变量:
以年份,合计(单位:千亿元),农、林、牧、渔业,采矿业,制造 业电力、热力、燃气及水生产和供应业,建筑业,批发和零售业,交通运输、仓储和邮政业作为变量。
实验方法:因子分析法
软件:
操作过程:
第一步:导入Excel数据文件???
1. open data document——open data——open;
2. Opening excel data source——OK.
第二步:
1.数据标准化:在最上面菜单里面选中Analyze——Descriptive Statistics——OK?(变量选择除年份、合计以外的所有变量).
2. 降维:在最上面菜单里面选中Analyze——Dimension Reduction——Factor?,变量选择标准化后的数据.
3. 点击右侧Descriptive,勾选Correlation Matrix选项组中的Coefficients和KMO and Bartlett’s text of sphericity,点击Continue.
4.点击右侧Extraction,勾选Scree Plot和fixed number with factors,默认3个,点击Continue.
5.点击右侧Rotation,勾选Method选项组中的Varimax;勾选Display选项组中的Loding Plot(s);点击Continue.
6.点击右侧Scores,勾选Method选项组中的Regression;勾选Display factor score coefficient matrix;点击Continue.
7.点击右侧Options,勾选Coefficient Display Format选项组中所有选项,将Absolute value blow改为,点击Continue.
8.返回主对话框,单击OK.
输出结果分析:
1.描述性统计量
Descriptive Statistics
农、林、牧、渔业 采 矿 业 制 造 业
电力、热力、燃气及水生产和供应业 建 筑 业 批发和零售业
交通运输、仓储和邮政业 Valid N (listwise)
N
11 11 11 11
Minimum
.6 .44
Maximum
Mean
Std. Deviation
11 11 11 11
.82
该表提供分析过程中包含的统计量,表格显示了样本容量以及11个变量的最小值、最大值、平均值、标准差。
和球形Bartlett检验
KMO and Bartlett's Test
Kaiser-Meyer-Olkin Measure of Sampling Adequacy. Bartlett's Test of Sphericity Approx. Chi-Square
.744
df 21
Sig. .000
该表给出了因子分析的KMO和Bartlett检验结果。从表中可以看出,Bartlett球度检验的概率p值为,即假设被拒绝,也就是说,可以认为相关系数矩阵与单位矩阵有显着差异。同时,KMO值为,根据KMO度量标准可知,原变量适合进行因子分析。
3.因子分析的共同度
Communalities
Zscore(农、林、牧、渔业) Zscore: 采 矿 业 Zscore: 制 造 业 Zscore(电力、热力、燃气及水生产和供应业) Zscore: 建 筑 业 Zscore(批发和零售业) Zscore(交通运输、仓储和邮政业)
Initial
Extraction
.883 .741 .974 .992 .987 .965 .935
Extraction Method: Principal Component Analysis.
表格所示是因子分析的共同度。表格第二列显示初始共同度,全部为;第三列是按照提取3个公因子得到的共同度,可以看到只有“采矿业”的共同度稍低,说明其信息丢失量稍严重。 4. 因子分析的总方差解释
Total Variance Explained Extraction Sums of Squared
Initial Eigenvalues
Component 1 2 3 4 5 6 7
% of
Total Variance
.413 .098 .011 .000
.152 .003
Cumulative
%
Loadings % of
Total Variance
Cumulative
%
Total
Rotation Sums of Squared Loadings
% of Variance
Cumulative
%
Extraction Method: Principal Component Analysis.
该表由3部分组成,分别为初始因子解的方差解释、提取因子解的方差解释和旋转因子解的方差解释。
Initial Eigenvalues部分描述了初始因子解的状况。第一个因子的特征根为,解释7个原始变量总方差的%;第二个因子的特征根为,解释7个原始变量总方差的%,累计方差贡献率为%;第三个因子的特征根为,解释7个原始变量总方差的%,累计方差贡献率为%,也就是说,三个变量解释了所有7各变量的90%以上,且也只有这三个变量的特征值大于1。 Extraction Sums of Squared Loadings部分和 Rotation Sums of Squared Loadings部分描述了因子提取后和旋转后的因子解。从表中看出,有三个因子提取和旋转,其累计解释总方差百分比和初始解的前三个变量相同,但经旋转后的因子重新分配各个因子的解释原始变量的方差,使得因子的方差更接近,也更易于解释。 5. 碎石图 利用因子分析的碎石图可以更加直观的发现最优因子的数量。在碎石图中,横坐标表示因子数目,纵坐标表示特征根。从图中可以看出,前三个因子的特征跟都很大,从第四个开始,因子的特征根都小于一,且连线变得较平缓,及前三个因子对解释变量的贡献最大, 6. 旋转前的因子载荷矩阵
Component Matrix
a
Component
Zscore(电力、热力、燃气及水生产和供应业)
Zscore(交通运输、仓储和邮政业) Zscore: 采 矿 业 Zscore(农、林、牧、渔业) Zscore(批发和零售业) Zscore: 建 筑 业 Zscore: 制 造 业
3
1 .871
2
.857 .704 .726 .687
.569 .3 .600
.793
Extraction Method: Principal Component Analysis. a. 3 components extracted.
该表空白处表示相应载荷小于。因子载荷矩阵中给出每一个变量在三个因子上的载荷。
在旋转前的载荷矩阵中所有变量在第一个因子上的载荷都较高,即与第一个因子的相关程度较高,第一个因子解释了大部分变量的信息;而后面两个因子与原始变量的相关程度较小,对原始变量的解释效果不明显,没有旋转的因子的含义很难解释。 7. 旋转后的因子载荷矩阵
Rotated Component Matrix
a
1
Zscore(农、林、牧、渔业) Zscore(交通运输、仓储和邮政业) 采 矿 业
Zscore(电力、热力、燃气及水生产和供应业)
Zscore: 建 筑 业 Zscore(批发和零售业) Zscore: 制 造 业
.9
.771 .749
2
Component
3
.352 .440
.441 .985
.873
.961
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization.
该表空白处表示相应载荷小于。因子载荷矩阵中给出每一个变量在三个因子上的载荷。
在旋转后的载荷矩阵中可以看出,与第一产业相关的产业在第一个因子上的载荷较高,与第二产业相关的产业在第二个因子上的载荷较高,与第三产业相关的产业在第三个因子上的载荷较高。和没旋转相比,因子的含义清楚很多。 8.旋转空间的因子图
该图为可以看做是旋转后的载荷矩阵的图形表示。从图中又一次验证了前面旋转后的载荷矩阵对因子的解释。
8. 因子得分系数
Component Score Coefficient Matrix
Zscore(农、林、牧、渔业) Zscore: 采 矿 业 Zscore: 制 造 业 Zscore(电力、热力、燃气及水生产和供应业) Zscore: 建 筑 业 Zscore(批发和零售业) Zscore(交通运输、仓储和邮政业)
Component
1 .445 .261
.201
2 .075
.008 .182
3
.093 .761 .263
.071
.429 .402 .204
.156
.050
Extraction Method: Principal Component Analysis. Rotation Method: Varimax with Kaiser Normalization. Component Scores.
列出了采用回归法估算的因子得分系数,根据表中的内容可以写出因子得分函数 F1=*Zscore1+**Zscore3+**Zscore5+**Zscore7 F2=**Zscore2+*Zscore3+**Zscore5+**Zscore7
F3=*Zscore1+*Zscore2+*Zscore3+*Zscore4+**Zscore6+*Zscore7
不仅如此,原数据文件中增加了变量FAC_1和FAC_2、FAC_3,表示3个因子在不同年份的得分值。
9.总因子得分及排序
附件:
原始数据:
标准化后的数据: