主成分分析与因子分析练习

基本信息

为了更好地理解人口结构特征,研究者对某城市的人口普查数据进行了处理,得到了200个空间单元的12个人口属性变量,所有人口属性变量均经过了标准化。各变量的意义如下:

问题

1. 对4个原始变量\(X_1 - X_4\)分别进行主成分分析和因子分析,得到2个主成分\(PC_1, PC_2\),以及2个公因子\(F_1, F_2\),它们之间的载荷矩阵如下所示。

\(X_1\) \(X_2\) \(X_3\) \(X_4\)
\(PC_1 / F_1\) \(a_{11}\) \(a_{12}\) \(a_{13}\) \(a_{14}\)
\(PC_2 / F_2\) \(a_{21}\) \(a_{22}\) \(a_{23}\) \(a_{24}\)

下列表述中正确的两项是(请使用空格分隔):

  1. 主成分分析是将原始变量变换为主成分:\(PC_1=a_{11}X_1+a_{12}X_2+a_{13}X_3+a_{14}X_4\)
  2. 主成分分析是用主成分解释原始变量:\(X_1=a_{11}PC_1+a_{21}PC_2+e_1\)
  3. 因子分析是将原始变量变换为公因子:\(F_1=a_{11}X_1+a_{12}X_2+a_{13}X_3+a_{14}X_4\)
  4. 因子分析是用公因子解释原始变量:\(X_1=a_{11}F_1+a_{21}F_2+e_1\)

请在SPSS中对你下载的数据进行数据降维,使用的变量为全部12个人口属性变量,根据分析结果回答2-8题。

(请使用如下默认设置:因子提取方法选择主成分法,因子旋转方法使用Varimax法,因子得分估计方法使用回归法)。

2. 作为因子分析的适宜性检验指标,请报告KMO统计量的值。(只有KMO大于一定标准,且Bartlett检验的零假设被拒绝,才适宜做因子分析)

3. 在提取主成分/公因子时,我们常常以“特征值大于1”作为标准,这表明我们希望主成分/公因子中的信息量要高于原始变量。请以该标准提取主成分/公因子,并回答下面2个问题:

  • 一共提取了多少个主成分/公因子:
  • 这些主成分/公因子的累积方差贡献率是多少(请填入小数,而非百分数):

4. 变量共同度(communalities)反映了每个原始变量中的变异的被解释的比例,请报告x1(留居1年以下的外来人口占比)的变量共同度(请输入小数,而非百分数):

5. 载荷(loadings)反映了主成分/公因子与原始变量的相关关系。对于公因子1(载荷矩阵的第1列),请在初始载荷矩阵中找到并填入其绝对值最大和最小的载荷。

  • 绝对值最大的初始载荷:
  • 绝对值最小的初始载荷:

6. 因子旋转可以使载荷的分布更加两极分化,以便于因子命名。同样对于公因子1(载荷矩阵的第1列),请在因子旋转后的载荷矩阵中找到并填入其绝对值最大和最小的载荷。

  • 绝对值最大的旋转后载荷:
  • 绝对值最小的旋转后载荷:

7. 因子命名是因子分析中必不可少的步骤。对于你所提取的最后一个公因子(载荷矩阵的最后1列),请从下面的选项中选择最适合的命名方式:

  1. 迁移特征因子
  2. 白领人口因子
  3. 低阶工作人口因子
  4. 老龄化因子

8. 因子得分可以代替原始变量进行后续分析,请报告第1个样本在公因子1上的因子得分。

9. 请对各个公因子的因子得分做相关分析,在下方填入公因子1与公因子2之间的Pearson相关系数和相应的p值。

  • Pearson相关系数:
  • p值: