跳转至

第八章:因子分析

总览


一段话总结

因子分析是通过对研究变量的信息矩阵分析,找出少数综合变量(因子)解释多个可观测变量间复杂关系的方法。它源于Spearman对学生考试成绩的研究,主要有R型(对变量)和Q型(对样品)两种类型。其数学模型包含公共因子和特殊因子,因子载荷阵估计方法多样,如主成分法等。因子旋转可使因子含义更明确,还可通过最小二乘法、回归法等计算因子得分,在商业、体育、经济等多领域广泛应用,如分析企业形象评价、奥运会项目成绩、地区经济发展、消费者偏好等。


exported_image.png

详细总结

  1. 因子分析的起源与基本概念
    • 起源:1904年Charles Spearman发表论文《对智力测验得分进行统计分析》,研究学生考试成绩,成为因子分析的起点。他发现学生各科考试成绩间存在某种潜在联系,提出最初的因子分析模型 \(X_{i}=a_{i}F+\varepsilon_{i}\)
    • 基本思想:通过分析研究变量的信息矩阵(协方差阵、相关系数矩阵或样品相似系数矩阵),找出少数几个不可观测的综合变量(因子),描述原始变量间的相关或相似关系。
    • 类型:常用的因子分析类型是R型因子分析(对变量作因子分析)和Q型因子分析(对样品作因子分析),本章侧重讨论R型因子分析。
  2. 因子分析的数学模型
    • 正交因子模型:用矩阵表示因子分析模型,将原始变量分解为公共因子和特殊因子两部分。
    • 因子载荷的统计意义:因子载荷反映了原始变量与公共因子之间的相关程度。
    • 变量共同度的统计意义:变量方差等于公共因子方差与特殊因子方差之和,即变量方差 = 共同度 + 剩余方差。方差贡献率是衡量公共因子相对重要程度的指标,方差贡献率越大,该公共因子越重要。
  3. 因子载荷阵的估计方法:有主成分法、主因子法、最小二乘法、极大似然法等多种方法,这些方法出发点不同,所得结果也不完全相同。以主成分法为例,通过计算可得到因子载荷阵,进而确定公共因子及其对原始变量的贡献。
  4. 因子旋转:因子载荷不唯一,为使因子含义更明确,Thurstone提出“简单结构”,旋转后的载荷矩阵每列元素平方值向0和1两极分化。凯泽提出相关方法,当公共因子数m>2时,可逐次对每两个公共因子进行旋转,使两列元素平方的相对方差之和达到最大。通过因子旋转,可使因子有更明确的含义,如在奥运会十项全能运动项目得分数据的因子分析中,旋转后得到短跑速度因子、爆发性臂力因子、爆发腿力因子和长跑耐力因子。
  5. 因子得分:计算因子得分的方法有最小二乘法和回归法等。在实际应用中,如对全国30个省市自治区的经济发展八项指标作因子分析时,通过SPSS软件操作,可得到因子得分系数矩阵,进而得到因子得分函数,生成样本标准化因子得分变量,用于对样品或变量进行评价和分类。
  6. 因子分析的应用案例
    • 商业企业形象评价:消费者通过一系列指标评价百货商场,真正关心的是商店环境、商店服务和商品价格,这些潜在因素通过具体指标间接反映。
    • 奥运会项目成绩分析:对奥运会十项全能运动项目得分数据进行因子分析,可找出影响运动员成绩的主要因子,如短跑速度因子、爆发性臂力因子等。
    • 地区经济发展评估:对全国30个省市自治区的经济发展八项指标作因子分析,可提取总量因子、消费因子和价格因子,对各地区经济发展进行评价和分类。
    • 消费者偏好研究:研究消费者对购买牙膏偏好的调查数据,通过因子分析可提取护牙因子和美牙因子,为牙膏生产企业开发新产品提供参考。
应用案例 分析内容 关键结果
商业企业形象评价 通过指标评价商场,找出潜在影响因素 潜在因素为商店环境、服务和价格
奥运会项目成绩分析 对十项全能项目得分进行因子分析 得到短跑速度、爆发性臂力等因子
地区经济发展评估 对30个省市自治区八项经济指标分析 提取总量、消费、价格因子
消费者偏好研究 分析消费者对牙膏偏好数据 提取护牙因子和美牙因子
---
### 关键问题
1. 因子分析中如何确定因子的个数?
- 答案:通常根据特征根和累计方差贡献率来确定。一般选取特征根大于1的因子,或者使累计方差贡献率达到一定比例(如70% - 85%以上)的因子个数。例如在研究消费者对购买牙膏偏好的调查数据时,提取两个因子累计方差贡献率就达到82%,第三个特征根相比下降较快,因此选取两个公共因子。
2. 因子分析与主成分分析的主要区别是什么?
- 答案:因子分析旨在用少数几个潜在变量(公共因子)解释多个显在变量中的复杂关系,每个原始变量分解为公共因子和特殊因子两部分;主成分分析是将多个指标化为少数几个互不相关的综合指标(主成分),主要用于数据降维。因子分析的因子通常是不可观测的,而主成分是原始变量的线性组合,是可观测的。
3. 在实际应用中,R型因子分析和Q型因子分析分别适用于哪些场景?
- 答案:R型因子分析适用于研究多个变量之间的相关性,找出影响这些变量的公共因子,如分析学生多门课程成绩之间的关系,找出潜在的影响因素(如学习能力等);分析消费者对多种产品属性的评价数据,提取关键因子。Q型因子分析适用于对样品进行分类和综合评价,如对不同企业的经营数据进行分析,对企业进行分类;对不同地区的环境监测数据进行分析,找出相似的地区类别 。
## 8.1 什么是因子分析
该节主要介绍了因子分析的基本概念,具体内容如下:
  1. 实际案例引入:以学生课程成绩和商业企业形象评价为例,说明实际中存在多个可观测变量受潜在因素影响的情况。学生课程成绩受学习能力等潜在共同因素影响,同时也受课程特点因素影响,如英语受语言能力影响。在商业企业形象评价中,消费者通过一系列指标评价商场,但真正关心商店环境、商店服务和商品价格,其中商店环境和服务质量需通过其他具体指标间接反映。
  2. 因子分析核心概念什么是因子分析.jpeg
    • 定义:因子分析是利用少数几个潜在变量(公共因子)去解释多个显在变量(可观测变量)中存在的复杂关系。
    • 变量分解:每个原始可观测变量可分解为两部分,一部分是公共因子,它是影响多个变量的共同因素;另一部分是特殊因子,是每个原始变量独自具有的因素,特殊因子的存在使不同原始变量有所区别。

8.1.1 Spearman的因子分析

研究背景与发现

Spearman对“高级预备学校”33名学生的古典语(C)、法语(F)、英语(E)、数学(M)、判别(D)和音乐(Mu)六门考试成绩相关性进行研究。通过分析相关阵,他发现不考虑对角元素时,任意两列元素大致成比例。如C列和E列对应元素比值近似相等,约为1.2 。

因子分析模型提出

基于上述发现,Spearman提出因子分析模型\(X_{i}=a_{i}F+\varepsilon_{i}\) 。其中,\(X_{i}\)为第\(i\)门科目标准化后的考试成绩(均值为0,方差为1 );\(F\)公共因子,对各科考试成绩均有影响,假设其均值为0,方差为1 ;\(\varepsilon_{i}\)特殊因子,仅对第\(i\)门成绩有影响,假设均值为0且与\(F\)不相关。

相关推导与重要指标

  • 协方差推导:通过计算\(Cov(X_{i},X_{j}) = E(a_{i}F+\varepsilon_{i})(a_{j}F+\varepsilon_{j}) = a_{i}a_{j}Var(F)=a_{i}a_{j}\) ,得出\(\frac{Cov(X_{i},X_{j})}{Cov(X_{i},X_{k})}=\frac{a_{j}}{a_{k}}\) ,与观察到的列元素成比例现象一致。
  • 方差推导与重要指标:由\(Var(X_{i}) = Var(a_{i}F+\varepsilon_{i}) = a_{i}^{2}Var(F)+Var(\varepsilon_{i})\) ,且\(F\)\(X_{i}\)方差均为1,可得\(1 = a_{i}^{2}+Var(\varepsilon_{i})\) 。这里\(a_{i}^{2}\)称为共同度,反映因子\(F\)解释\(X_{i}\)方差的比例;\(a_{i}\)称为因子载荷,是因子分析重要指标。

求解方法

  1. 数据收集与相关阵计算:收集多门科目成绩数据,计算成绩之间的相关系数,构建相关阵。
  2. 观察相关阵特征:观察相关阵中列元素(非对角元素)是否大致成比例。
  3. 构建与验证模型:若存在列元素成比例现象,构建\(X_{i}=a_{i}F+\varepsilon_{i}\)模型,并通过协方差、方差等推导验证模型合理性,计算因子载荷\(a_{i}\)和共同度\(a_{i}^{2}\)

例子

假设有5名学生的语文(\(X_1\))、数学(\(X_2\))成绩数据如下(已标准化): |学生|语文成绩|数学成绩| | ---- | ---- | ---- | |1|0.5|0.4| |2|-0.3| -0.2| |3|0.8|0.6| |4|-0.1| -0.1| |5|0.4|0.3|

  1. 计算相关阵
  2. 计算语文和数学成绩的协方差\(Cov(X_1,X_2)\)
    • 均值\(\bar{X_1}=\frac{0.5 - 0.3 + 0.8 - 0.1 + 0.4}{5}=0.26\)\(\bar{X_2}=\frac{0.4 - 0.2 + 0.6 - 0.1 + 0.3}{5}=0.24\)
    • \(Cov(X_1,X_2)=\frac{1}{5}\sum_{k = 1}^{5}(X_{1k}-\bar{X_1})(X_{2k}-\bar{X_2})=\frac{(0.5 - 0.26)(0.4 - 0.24)+(-0.3 - 0.26)(-0.2 - 0.24)+(0.8 - 0.26)(0.6 - 0.24)+(-0.1 - 0.26)(-0.1 - 0.24)+(0.4 - 0.26)(0.3 - 0.24)}{5}=0.096\)
  3. 语文成绩方差\(Var(X_1)=\frac{1}{5}\sum_{k = 1}^{5}(X_{1k}-\bar{X_1})^2 = 0.1624\) ,数学成绩方差\(Var(X_2)=\frac{1}{5}\sum_{k = 1}^{5}(X_{2k}-\bar{X_2})^2 = 0.1224\)
  4. 相关系数\(r_{12}=\frac{Cov(X_1,X_2)}{\sqrt{Var(X_1)Var(X_2)}}=\frac{0.096}{\sqrt{0.1624\times0.1224}}\approx0.69\) ,相关阵为\(\begin{bmatrix}1&0.69\\0.69&1\end{bmatrix}\)
  5. 观察相关阵特征:由于只有两门科目,可简单看相关系数体现的相关性。这里相关系数为0.69 ,说明存在一定关联。
  6. 构建模型并计算
  7. 假设符合\(X_{i}=a_{i}F+\varepsilon_{i}\)模型。设\(F\)为学习能力公共因子,\(\varepsilon_{1}\)\(\varepsilon_{2}\)为语文和数学各自特殊因子。
  8. \(Cov(X_1,X_2)=a_1a_2 = 0.096\) ,假设\(a_1 = 0.4\) ,则\(a_2=\frac{0.096}{0.4}=0.24\)
  9. 对于语文,根据\(1 = a_{1}^{2}+Var(\varepsilon_{1})\) ,可得\(Var(\varepsilon_{1})=1 - 0.4^2 = 0.84\) ,共同度\(a_{1}^{2}=0.16\) ;对于数学,\(Var(\varepsilon_{2})=1 - 0.24^2 = 0.9424\) ,共同度\(a_{2}^{2}=0.0576\)

8.1.2 因子分析的基本思想

  • 核心目标:通过分析变量的信息矩阵(如协方差阵、相关系数矩阵),找出控制所有原始变量的少数综合变量(因子),描述变量间的相关关系。
  • 因子性质:这些综合变量不可观测,是抽象的潜在变量。
  • 主要类型
    • R型因子分析:针对变量进行分析。
    • Q型因子分析:针对样品进行分析,本章侧重R型。
  • 应用方向
    • 将复杂变量综合为少数因子,呈现变量与因子的结构关系。
    • 基于因子对样品或变量进行评价与分类。

8.1.3 因子分析的数学模型初探

  • 变量分解:每个可观测变量受公共因子和特殊因子共同影响。如学生课程成绩受“学习能力”等公共因子影响,也受“语言能力”“推理能力”等特殊因子影响。
  • 潜在变量与可测变量关系:潜在变量(如商店环境、服务质量)需通过可测指标(如装修评分、服务态度评分)间接反映。

8.1.4 因子分析的典型案例

Spearman关于智力的研究

  • 研究对象:33名学生的六门课程成绩(古典语C、法语F、英语E、数学M、判别D、音乐Mu)。
  • 数据处理
    • 计算六门课程成绩的相关矩阵,发现非对角元素大致成比例。如C列和E列元素比例关系近似成立。
  • 模型建立
    • 提出模型:\(X_i = a_iF + \varepsilon_i\),其中\(X_i\)为第\(i\)门课程成绩,\(F\)为公共因子(如一般智力),\(a_i\)为因子载荷,\(\varepsilon_i\)为特殊因子。
  • 结论:该模型表明各科成绩可由一个公共因子和自身特殊因子解释,验证了因子分析的可行性。

商业企业形象评价案例

  • 可测指标:消费者通过一系列具体指标评价百货商场。
  • 潜在因子:实际关心的“商店环境”“商店服务”“商品价格”等抽象因子,需通过具体指标间接反映。

沉积学研究案例

  • 研究问题:1957年Krumbren在沉积学研究中应用因子分析方法。
  • 分析逻辑:通过因子分析处理多个沉积学相关变量,提取潜在的控制因子,揭示地质现象的内在关系。

8.2 因子分析的数学模型

8.2.1 正交因子模型的基本形式

  • 数学表达式
    \(X=(X_1,X_2,\dots,X_p)^T\)为可观测变量向量,\(F=(F_1,F_2,\dots,F_m)^T\)为公共因子向量,\(\varepsilon=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_p)^T\)为特殊因子向量,则因子分析模型可表示为:
    [ \begin{cases} X_1 = a_{11}F_1 + a_{12}F_2 + \dots + a_{1m}F_m + \varepsilon_1 \ X_2 = a_{21}F_1 + a_{22}F_2 + \dots + a_{2m}F_m + \varepsilon_2 \ \vdots \ X_p = a_{p1}F_1 + a_{p2}F_2 + \dots + a_{pm}F_m + \varepsilon_p \end{cases} ]
    其中\(a_{ij}\)为因子载荷,衡量第\(i\)个变量与第\(j\)个公共因子的相关程度。

  • 模型假设

  • 公共因子\(F\)与特殊因子\(\varepsilon\)不相关,即\(\text{Cov}(F,\varepsilon)=0\)
  • 公共因子之间正交且方差为1,即\(\text{Cov}(F_i,F_j)=0\)\(i\neq j\)),\(\text{Var}(F_j)=1\)
  • 特殊因子方差为\(\psi_i^2\),即\(\text{Var}(\varepsilon_i)=\psi_i^2\),且不同特殊因子之间不相关。

8.2.2 矩阵形式与参数定义

  • 矩阵表示
    模型可简写为:
    [ X = AF + \varepsilon ]
    其中\(A=(a_{ij})_{p \times m}\)为因子载荷阵,\(F\)\(\varepsilon\)为列向量。

  • 协方差结构
    \(\text{Cov}(F)=\text{I}_m\)(单位矩阵),\(\text{Cov}(\varepsilon)=\Psi=\text{diag}(\psi_1^2,\psi_2^2,\dots,\psi_p^2)\),则变量的协方差阵为:
    [ \Sigma = A A^T + \Psi ]

8.2.3 因子载荷的统计意义

  • 相关系数解释
    因子载荷\(a_{ij}\)表示变量\(X_i\)与公共因子\(F_j\)的相关系数,即:
    [ a_{ij} = \text{Corr}(X_i, F_j) ]
    例:若\(a_{11}=0.8\),则变量\(X_1\)与因子\(F_1\)的线性相关性为0.8,说明\(F_1\)\(X_1\)的影响较强。

  • 方差贡献分解
    变量\(X_i\)的方差可分解为公共因子方差与特殊因子方差之和:
    [ \text{Var}(X_i) = \sum_{j=1}^m a_{ij}^2 + \psi_i^2 ]
    其中\(\sum_{j=1}^m a_{ij}^2\)称为变量\(X_i\)共同度(Communality),记为\(h_i^2\),表示公共因子解释\(X_i\)方差的比例;\(\psi_i^2\)为剩余方差,由特殊因子解释。

8.2.4 变量共同度与方差贡献率

  • 共同度的意义
    共同度\(h_i^2\)越接近1,说明公共因子对变量\(X_i\)的解释力越强。例如,若\(h_1^2=0.7\),则\(X_1\)的70%方差可由公共因子解释,剩余30%由特殊因子解释。

  • 方差贡献率
    \(j\)个公共因子\(F_j\)的方差贡献率定义为:
    [ \text{贡献率}j = \frac{\sum ]}^p a_{ij}^2}{p
    该指标衡量\(F_j\)对所有变量的综合影响程度,贡献率越大,因子越重要。累计方差贡献率则为前\(k\)个因子的贡献率之和,用于确定因子个数(如累计贡献率达80%以上时认为因子提取充分)。

8.2.5 案例:Spearman智力研究的因子模型

  • 问题背景:Spearman对33名学生的6门课程成绩(古典语C、法语F、英语E、数学M、判别D、音乐Mu)进行因子分析,假设成绩由一个公共因子\(F\)(一般智力)和特殊因子\(\varepsilon_i\)构成。

  • 模型构建
    以英语成绩\(E\)和数学成绩\(M\)为例,模型可表示为:
    [ \begin{cases} E = a_E F + \varepsilon_E \ M = a_M F + \varepsilon_M \end{cases} ]
    根据相关矩阵,\(\text{Corr}(E,M)=0.64\),由因子模型可得:
    [ \text{Corr}(E,M) = a_E a_M \quad (\text{因} \text{Var}(F)=1, \text{Cov}(\varepsilon_E,\varepsilon_M)=0) ]
    若假设\(a_E=0.8\)\(a_M=0.8\),则\(\text{Corr}(E,M)=0.64\),与实际数据一致。

  • 共同度计算
    英语成绩的共同度\(h_E^2 = a_E^2 = 0.8^2 = 0.64\),表示一般智力因子解释了英语成绩64%的方差,剩余36%由英语特有的能力(如语言理解)等特殊因子解释。

  • 方差贡献率
    单个公共因子的方差贡献率为\(\frac{\sum_{i=1}^6 a_i^2}{6}\)。若各课程的因子载荷均为0.8,则贡献率为\(\frac{6 \times 0.8^2}{6} = 0.64\),即该因子解释了所有课程成绩64%的总方差。

8.2.6 模型拓展:多因子案例

  • 商业企业形象评价模型
    设消费者对商场的评价变量为\(X_1\)(装修评分)、\(X_2\)(服务态度评分)、\(X_3\)(商品价格评分),潜在因子为\(F_1\)(环境因子)、\(F_2\)(服务因子),则模型为:
    [ \begin{cases} X_1 = a_{11}F_1 + a_{12}F_2 + \varepsilon_1 \ X_2 = a_{21}F_1 + a_{22}F_2 + \varepsilon_2 \ X_3 = a_{31}F_1 + a_{32}F_2 + \varepsilon_3 \end{cases} ]
    \(a_{11}=0.9\)\(a_{12}=0.1\),则\(X_1\)主要受\(F_1\)(环境因子)影响;若\(a_{22}=0.8\),则\(X_2\)主要受\(F_2\)(服务因子)影响。

  • 共同度与贡献率计算
    变量\(X_1\)的共同度\(h_1^2 = 0.9^2 + 0.1^2 = 0.82\),说明环境和服务因子共解释了\(X_1\)82%的方差。
    \(F_1\)的载荷平方和为\(0.9^2 + 0.2^2 + 0.3^2 = 0.94\),则\(F_1\)的方差贡献率为\(\frac{0.94}{3} \approx 0.313\)(31.3%),\(F_2\)的贡献率可类似计算。

8.3 因子载荷阵的估计方法

8.3.1 主成分法(Principal Components Method)

方法原理与步骤

  • 核心思想:通过主成分分析提取变量的主要变异方向,将主成分转化为因子载荷阵,适用于初始因子提取。
  • 具体步骤
  • 计算相关矩阵:对可观测变量\(X_1, X_2, \dots, X_p\)计算样本相关矩阵\(R\)
  • 求解特征值与特征向量:计算\(R\)的特征值\(\lambda_1 \geq \lambda_2 \geq \dots \geq \lambda_p \geq 0\)及对应的单位特征向量\(\gamma_1, \gamma_2, \dots, \gamma_p\)
  • 确定公共因子个数\(m\):通常选取累计方差贡献率达80%以上的前\(m\)个特征值。
  • 构造因子载荷阵:第\(i\)个变量在第\(j\)个公共因子上的载荷为\(a_{ij} = \gamma_{ij} \sqrt{\lambda_j}\),其中\(\gamma_{ij}\)为第\(j\)个特征向量的第\(i\)个分量。
  • 与主成分分析的联系
    主成分分析模型为\(Y_j = \sum_{i=1}^p \gamma_{ij} X_i\),而因子分析模型可视为主成分的逆过程,通过\(X_i = \sum_{j=1}^m a_{ij} F_j + \varepsilon_i\)实现变量分解。

案例:Spearman智力研究的主成分法应用

  • 数据背景:33名学生6门课程成绩的相关矩阵(部分数据):
    | | E | M | D | Mu | |---|---|---|---|---| | E | 1 | 0.64 | 0.54 | 0.51 | | M | 0.64 | 1 | 0.45 | 0.51 | | D | 0.54 | 0.45 | 1 | 0.40 | | Mu| 0.51 | 0.51 | 0.40 | 1 |
  • 计算步骤
  • 计算相关矩阵特征值:假设前1个特征值\(\lambda_1 = 3.2\),对应特征向量\(\gamma_1 = (0.7, 0.6, 0.5, 0.5)^T\)(以E、M、D、Mu为例)。
  • 计算因子载荷
    \(a_{ij} = \gamma_{ij} \sqrt{\lambda_1}\),如:
    • 英语(E)的载荷:\(a_{E1} = 0.7 \times \sqrt{3.2} \approx 0.7 \times 1.789 \approx 1.252\)
    • 数学(M)的载荷:\(a_{M1} = 0.6 \times \sqrt{3.2} \approx 1.073\)
  • 构建因子模型
    \(X_i = a_{i1}F_1 + \varepsilon_i\),即各科成绩由公共因子\(F_1\)(一般智力)和特殊因子\(\varepsilon_i\)构成。
  • 结果解释
    因子载荷反映变量与公共因子的相关性,如英语成绩与\(F_1\)的相关系数约为1.252(标准化后),说明一般智力对英语成绩的影响较强。

8.3.2 主因子法(Principal Factor Method,主轴因子法)

方法原理与步骤

  • 核心思想:考虑变量的特殊因子方差,通过“约相关矩阵”提取因子,适用于共同度已知或可估计的场景。
  • 具体步骤
  • 初始共同度估计
    • 常用方法:\(h_i^2 = \text{Var}(X_i) - \psi_i^2\),初始值可设为\(h_i^2 = \max|R_{ij}|^2\)\(R_{ij}\)为相关系数),或直接取1(假设特殊因子方差为0)。
  • 构造约相关矩阵
    约相关矩阵\(R^* = (r_{ij}^*)\),其中\(r_{ii}^* = h_i^2\)\(r_{ij}^* = r_{ij}\)\(i \neq j\))。
  • 求解约相关矩阵的特征值与特征向量:得到特征值\(\lambda_j^*\)和特征向量\(\gamma_j^*\)
  • 计算因子载荷\(a_{ij} = \gamma_{ij}^* \sqrt{\lambda_j^*}\)
  • 迭代更新共同度
    计算新的共同度\(h_i^2 = \sum_{j=1}^m a_{ij}^2\),重复步骤2-4直至共同度收敛(变化小于阈值)。
  • 与主成分法的区别
    主成分法假设\(h_i^2 = 1\)(忽略特殊因子),而主因子法通过迭代估计真实共同度,更贴近实际模型。

案例:十项全能运动项目的主因子法应用

  • 数据背景:奥运会十项全能项目(百米跑、跳远、铅球等10项成绩)的相关矩阵,需提取公共因子。
  • 计算步骤
  • 初始共同度估计:假设各变量初始共同度\(h_i^2 = 0.8\)(经验值)。
  • 构造约相关矩阵:对角元素设为0.8,非对角元素保留原始相关系数(如百米跑与跳远的相关系数\(r=0.7\),则\(r^*=0.7\))。
  • 特征值分析:计算约相关矩阵的前2个特征值\(\lambda_1^*=4.5\)\(\lambda_2^*=2.3\),对应特征向量:
    \(\gamma_1^* = (0.8, 0.7, 0.3, \dots)^T\)\(\gamma_2^* = (0.2, 0.1, 0.8, \dots)^T\)(以部分项目为例)。
  • 计算因子载荷
    • 百米跑在\(F_1\)的载荷:\(a_{11} = 0.8 \times \sqrt{4.5} \approx 0.8 \times 2.121 \approx 1.697\)
    • 铅球在\(F_2\)的载荷:\(a_{32} = 0.8 \times \sqrt{2.3} \approx 0.8 \times 1.517 \approx 1.214\)
  • 迭代更新共同度
    首次计算的共同度\(h_1^2 = 1.697^2 \approx 2.88\)(超过1,需标准化),调整后重新计算约相关矩阵,直至\(h_i^2\)稳定在合理范围(如0.6-0.9)。
  • 结果解释
    因子\(F_1\)在速度类项目(百米跑、跳远)上载荷高,可命名为“速度因子”;\(F_2\)在力量类项目(铅球、铁饼)上载荷高,可命名为“力量因子”。

8.3.3 其他估计方法概述

  • 最小二乘法(Least Squares)
    目标是最小化观测协方差阵与模型协方差阵的差异,即\(\min \|R - (AA^T + \Psi)\|^2\),通过迭代求解\(A\)\(\Psi\)
  • 极大似然法(Maximum Likelihood)
    假设变量服从多元正态分布,通过最大化似然函数估计参数,需满足\(R = AA^T + \Psi\),适用于大样本数据。
  • 因子提取法对比
    | 方法 | 核心假设 | 优点 | 适用场景 | |--------------|------------------------------|--------------------------|--------------------------| | 主成分法 | 忽略特殊因子(\(\Psi=0\)) | 计算简单,无需迭代 | 探索性分析,初始因子提取 | | 主因子法 | 考虑特殊因子,迭代估计共同度 | 贴近真实模型 | 需精确共同度的场景 | | 极大似然法 | 变量服从正态分布 | 统计性质优良 | 大样本、理论推断 |

8.3.4 案例:主成分法与主因子法的结果对比

  • 数据场景:某地区5项经济指标(GDP、消费、投资等)的相关矩阵,使用主成分法和主因子法提取2个公共因子。
  • 结果差异
    | 方法 | 因子1载荷(GDP) | 因子2载荷(投资) | 共同度(GDP) | |------------|------------------|------------------|---------------| | 主成分法 | 0.92 | 0.31 | 0.92²=0.85 | | 主因子法 | 0.87 | 0.45 | 0.87²+0.45²=0.93 |
  • 原因分析
    主因子法通过迭代考虑了特殊因子方差,使共同度更高,因子载荷更聚焦于公共因子的解释力,而主成分法因忽略特殊因子,可能高估公共因子的贡献。

8.4 因子旋转

8.4.1 因子旋转的本质与目的

  • 因子载荷的不唯一性
    \(A\)是因子载荷阵,\(T\)为正交矩阵,则\(AT\)也是合法的载荷阵,即因子解不唯一。例如:
    [ X = AF + \varepsilon = (AT)(T^TF) + \varepsilon ]
    其中\(T^TF\)是新的公共因子向量,与原因子正交。
  • 旋转的核心目标
    通过正交或斜交变换,使因子载荷矩阵的结构简化,实现“简单结构”——载荷值向0和1两极分化,便于因子命名与解释。

8.4.2 正交旋转(Orthogonal Rotation)

方差最大法(Varimax)

  • Thurstone简单结构原则
    旋转后每个变量仅在一个因子上有高载荷,在其他因子上载荷接近0;每个因子应至少在几个变量上有高载荷,避免因子无实际意义。
  • Kaiser方差最大法步骤
  • 目标函数:最大化各因子载荷平方的相对方差,公式为:
    [ V = \frac{1}{p} \sum_{j=1}^m \left[ \sum_{i=1}^p (a_{ij}^2 / h_i2)2 - \frac{1}{p} \left( \sum_{i=1}^p a_{ij}^2 / h_i^2 \right)^2 \right] ]
    其中\(h_i^2\)为变量共同度,最大化\(V\)可使载荷矩阵每列元素平方值尽可能集中于0或1。
  • 正交变换矩阵
    对第\(l\)\(k\)个因子,旋转矩阵\(T\)为:
    [ T = \begin{pmatrix} \cos\theta & \sin\theta \ -\sin\theta & \cos\theta \end{pmatrix} ]
    角度\(\theta\)由下式确定:
    [ \tan4\theta = \frac{2\sum_{i=1}^p (a_{il}^2 - a_{ik}2)(a_{il}a_{ik}/h_i2)}{\sum_{i=1}^p (a_{il}^4 + a_{ik}^4 - 2(a_{il}a_{ik}/h_i2)2)} ]
  • 逐次旋转:对\(m\)个因子逐对旋转(如先旋转\(F_1\)\(F_2\),再旋转\(F_1\)\(F_3\)等),直至\(V\)收敛。

案例:十项全能运动项目的方差最大旋转

  • 原始数据:10项运动成绩(百米跑、跳远等)的初始因子载荷矩阵显示第一因子在所有项目上载荷均较高,其他因子难以解释。
  • 旋转前载荷矩阵(部分)
    | 项目 | 因子1 | 因子2 | |------------|-------|-------| | 百米跑 | 0.78 | 0.32 | | 铅球 | 0.56 | 0.61 | | 1500米跑 | 0.65 | 0.43 |
  • 旋转后载荷矩阵(部分)
    | 项目 | 因子1(速度) | 因子2(力量) | |------------|---------------|---------------| | 百米跑 | 0.92 | 0.11 | | 铅球 | 0.15 | 0.89 | | 1500米跑 | 0.85 | 0.23 |
  • 解释与命名
    旋转后因子1在速度类项目(百米跑、1500米跑)上载荷高,命名为“速度耐力因子”;因子2在力量类项目(铅球)上载荷高,命名为“爆发力量因子”。

8.4.3 斜交旋转(Oblique Rotation)

Promax法

  • 适用场景:当公共因子间存在相关性时,斜交旋转允许因子相关,更贴近实际数据结构。
  • 核心步骤
  • 先进行正交旋转(如方差最大法)得到正交因子载荷阵\(A\)
  • 构造斜交因子:通过幂变换生成斜交因子,公式为:
    [ a_{ij}^* = a_{ij} / |a_{ij}|^\delta \quad (\delta \geq 1,通常取2) ]
    变换后因子间相关系数\(\Phi_{jk} = \sum_{i=1}^p a_{ij}^* a_{ik}^* / p\)
  • 标准化处理:确保因子方差为1,最终得到斜交载荷阵。
  • 与正交旋转的对比
    | 方法 | 因子相关性 | 共同度变化 | 解释难度 | |------------|------------|------------|----------| | 正交旋转 | 不相关 | 不变 | 简单 | | 斜交旋转 | 相关 | 可能改变 | 复杂但更真实 |

案例:消费者牙膏偏好调查的斜交旋转

  • 原始因子:正交旋转后得到“护牙因子”和“美牙因子”,假设实际中两者可能存在相关性(如注重护牙的消费者也可能关注美牙)。
  • Promax旋转步骤
  • 正交旋转后的载荷阵(部分):
    | 陈述 | 因子1(护牙) | 因子2(美牙) | |--------------|---------------|---------------| | “预防蛀牙” | 0.96 | 0.02 | | “牙齿亮泽” | 0.05 | 0.85 |
  • 幂变换(\(\delta=2\)):
    [ a_{ij}^* = a_{ij} / |a_{ij}|^2 = 1 / |a_{ij}| \quad (a_{ij} \neq 0) ]
    如“预防蛀牙”在因子1的载荷变为\(1/0.96 \approx 1.04\),因子2的载荷变为\(1/0.02 = 50\)(实际计算中会标准化)。
  • 计算因子相关系数:
    \(\Phi_{12} = \sum_{i=1}^6 a_{i1}^* a_{i2}^* / 6 \approx 0.35\),表明护牙与美牙因子存在中等程度相关。
  • 结果意义
    斜交旋转后因子更符合现实逻辑(护牙与美牙并非完全独立),但解释时需同时考虑因子间相关性。

8.4.4 旋转效果评估与因子命名

  • 评估指标
  • 载荷矩阵结构:高载荷(绝对值>0.5)与低载荷(绝对值<0.3)的区分度是否明显。
  • 因子可解释性:能否根据高载荷变量赋予因子合理名称(如“学习能力因子”“消费习惯因子”等)。
  • 累计方差贡献率:旋转不改变累计贡献率,但可能使各因子贡献率重新分配。
  • 命名原则
  • 高载荷变量聚类:将载荷>0.5的变量归类,提取共同特征。
  • 避免主观偏差:基于变量实际含义而非预设理论命名。
  • 简洁性:名称需概括因子核心维度(如“科技创新因子”而非“企业研发投入与技术转化能力因子”)。

8.4.5 SPSS操作示例:方差最大旋转

  • 步骤解析
  • 在因子分析对话框中点击“Rotation”按钮,选择“Varimax”(方差最大法)。
  • 勾选“Rotated solution”和“Loading plot(s)”(载荷图)。
  • 输出结果包括旋转后的因子载荷矩阵、因子转换矩阵(\(T\))和载荷散点图。
  • 案例输出解读
    某经济指标数据旋转后,因子1在“GDP”“工业总产值”上载荷>0.9,命名为“经济总量因子”;因子2在“居民消费价格指数”上载荷>0.8,命名为“通货膨胀因子”。

8.4.6 特殊旋转方法拓展

  • 四次方最大法(Quartimax)
    目标是最大化每行载荷平方的方差,使每个变量仅在少数因子上有高载荷,适用于减少每个变量关联的因子数。
  • ** equamax法**:
    同时考虑行和列的方差最大化,介于方差最大法和四次方最大法之间,平衡因子和变量的简化程度。
  • 直接斜交法(Direct Oblimin)
    通过参数\(\delta\)控制因子相关程度,\(\delta=0\)时等价于正交旋转,\(\delta\)越大因子相关性越强。

8.5 因子得分

8.5.1 因子得分的定义与作用

  • 定义:因子得分是将公共因子表示为原始可观测变量的线性组合,即通过\(F_j = \sum_{i=1}^p w_{ij}X_i\)\(j=1,2,\dots,m\))计算每个样本在公共因子上的取值,其中\(w_{ij}\)为因子得分系数。
  • 核心作用
  • 降维表示:用少数因子得分代替原始变量,便于可视化和聚类分析。
  • 样本评价:基于因子得分对样本(如地区、消费者)进行排名或分类。
  • 后续分析:作为新变量输入回归、聚类等模型,挖掘数据深层结构。

8.5.2 最小二乘法(Least Squares)

方法原理与推导

  • 目标函数:通过最小化因子估计值与真实值的误差平方和,即\(\min \sum_{k=1}^n (F_{jk} - \hat{F}_{jk})^2\),其中\(n\)为样本数。
  • 基本假设:假设因子\(F\)与变量\(X\)满足线性关系,忽略特殊因子影响(\(\varepsilon \approx 0\))。
  • 求解步骤
  • 标准化原始变量:将\(X_i\)转化为\(Z_i = (X_i - \bar{X}_i)/s_i\),消除量纲影响。
  • 构建因子模型\(Z = AF\)(假设\(\varepsilon=0\)),其中\(A\)为标准化后的因子载荷阵。
  • 求解系数矩阵:因子得分系数\(W = (A^TA)^{-1}A^T\),即\(F = WZ\)

案例:全国30省市经济指标因子得分计算

  • 数据背景:8项经济指标(GDP、居民消费水平等)的因子分析,提取2个公共因子\(F_1\)(总量因子)、\(F_2\)(消费因子)。
  • 计算步骤
  • 标准化数据:如北京GDP为\(X_1=30000\)亿元,均值\(\bar{X}_1=15000\),标准差\(s_1=8000\),则\(Z_1=(30000-15000)/8000=1.875\)
  • 因子载荷阵(标准化后)
    | 指标 | \(F_1\) | \(F_2\) | |------------|--------|--------| | GDP(\(Z_1\)) | 0.94 | 0.13 | | 居民消费水平(\(Z_2\)) | 0.21 | 0.84 |
  • 计算得分系数
    [ W = (ATA) 0.31 & 0.01 \ 0.04 & 0.38 \end{pmatrix} ] }A^T = \begin{pmatrix
  • 计算因子得分
    北京的因子得分为:
    [ \begin{cases} F_1 = 0.31 \times 1.875 + 0.01 \times Z_2 \approx 0.581 \ F_2 = 0.04 \times 1.875 + 0.38 \times Z_2 \quad (\text{假设} Z_2=1.5 \text{时,} F_2 \approx 0.63) \end{cases} ]
  • 结果解释:北京的\(F_1\)得分0.581(高于均值),表明其经济总量指标表现较好;\(F_2\)得分0.63,消费因子表现中等。

8.5.3 回归法(Regression Method)

方法原理与推导

  • 核心思想:考虑因子与变量的统计相关性,通过回归模型估计因子得分,由Thomson(1951)提出,又称Thomson法。
  • 数学推导
    假设因子\(F\)与变量\(X\)的协方差为\(\text{Cov}(F,X)=A\),且\(\text{Var}(F)=I\)\(\text{Var}(X)=AA^T+\Psi\)。根据回归理论,因子得分的最优线性无偏估计为:
    [ \hat{F} = AT(AAT+\Psi)^{-1}X ]
    当变量标准化且\(\Psi\)近似为对角阵时,简化为:
    [ \hat{F} = ATRX ]
    其中\(R\)为相关矩阵。
  • SPSS实现:默认采用回归法计算因子得分,输出因子得分系数矩阵,得分公式为\(F_j = \sum_{i=1}^p w_{ij}Z_i\),其中\(w_{ij}\)为系数矩阵元素。

案例:消费者牙膏偏好的因子得分计算

  • 数据背景:6项牙膏属性评分(V1-V6),提取2个因子\(F_1\)(护牙因子)、\(F_2\)(美牙因子),旋转后载荷矩阵如下:
    | 陈述 | \(F_1\) | \(F_2\) | |------------|--------|--------| | V1(预防蛀牙) | 0.96 | -0.02 | | V2(牙齿亮泽) | -0.05 | 0.85 |
  • SPSS操作步骤
  • 在因子分析对话框中点击“Scores”按钮,选择“Regression”法,勾选“Save as variables”。
  • 输出因子得分系数矩阵(部分):
    | 变量 | \(F_1\)系数 | \(F_2\)系数 | |------------|------------|------------| | V1(标准化后) | 0.23 | -0.01 | | V2(标准化后) | -0.01 | 0.21 |
  • 得分计算示例:某消费者的标准化评分\(Z_1=1.2\)(V1),\(Z_2=0.8\)(V2),则:
    [ \begin{cases} F_1 = 0.23 \times 1.2 + (-0.01) \times 0.8 \approx 0.27 \ F_2 = (-0.01) \times 1.2 + 0.21 \times 0.8 \approx 0.16 \end{cases} ]
  • 结果应用:该消费者的\(F_1\)得分0.27(高于均值),表明更关注护牙属性;\(F_2\)得分0.16,对美牙属性关注度中等,可归为“护牙主导型”消费者。

8.5.4 因子得分的性质与应用

基本性质

  • 均值与方差
  • 因子得分的均值为0,即\(\bar{F}_j = 0\)
  • 得分的方差小于等于1,且因子间的协方差等于因子相关系数(斜交旋转时)。
  • 与原始变量的关系
    因子得分与原始变量的相关系数为\(\text{Corr}(F_j,X_i) = a_{ij} / \sqrt{h_i^2}\),其中\(a_{ij}\)为因子载荷,\(h_i^2\)为共同度。

典型应用场景

  • 样本分类与评价
    以全国省市经济数据为例,根据因子得分绘制散点图,将北京、上海等\(F_1\)高分地区归为“经济发达型”,甘肃、青海等低分地区归为“经济欠发达型”。
  • 动态趋势分析
    对同一地区不同年份的因子得分进行时序分析,如某省2020-2025年的\(F_1\)得分从0.3升至0.7,表明经济总量持续增长。
  • 与其他模型结合
    将因子得分作为自变量输入回归模型,如研究“经济总量因子”与“就业率”的关系,避免原始变量多重共线性问题。

8.5.5 其他因子得分方法

  • Bartlett法
    假设因子与变量满足多元正态分布,通过极大似然估计得分,公式为\(\hat{F} = (A^T\Psi^{-1}A)^{-1}A^T\Psi^{-1}X\),适用于小样本场景。
  • Anderson-Rubin法
    保证因子得分的正交性和方差为1,通过迭代求解使\(\hat{F}^T\hat{F}=I\),常用于理论推导。
  • 方法对比
    | 方法 | 假设条件 | 优点 | 适用场景 | |------------|------------------------------|--------------------------|--------------------------| | 最小二乘法 | 忽略特殊因子 | 计算简单 | 探索性分析 | | 回归法 | 考虑因子与变量相关性 | 统计性质优良 | 精确评价与推断 | | Bartlett法 | 变量服从正态分布 | 小样本下效率高 | 理论研究 |

8.5.6 SPSS实操与结果解读

操作流程

  1. 菜单选择:Analyze → Data Reduction → Factor,将变量移入列表。
  2. 得分设置:点击“Scores”按钮,选择“Regression”法,勾选“Display factor score coefficient matrix”。
  3. 结果输出
  4. 因子得分系数矩阵:直接用于计算得分函数。
  5. 新变量存储:生成如“FAC1_1”“FAC2_1”的因子得分变量,可在数据视图中查看。

案例结果解读

  • 系数矩阵示例:某教育指标因子分析的得分系数矩阵:
    | 指标 | \(F_1\)(教学质量) | \(F_2\)(科研能力) | |------------|---------------------|---------------------| | 师生比(\(Z_1\)) | 0.45 | 0.12 | | 论文数(\(Z_2\)) | 0.11 | 0.89 |
  • 得分计算:某高校\(Z_1=0.8\)\(Z_2=1.5\),则:
    [ \begin{cases} F_1 = 0.45 \times 0.8 + 0.11 \times 1.5 = 0.525 \ F_2 = 0.12 \times 0.8 + 0.89 \times 1.5 = 1.437 \end{cases} ]
  • 评价结论:该高校\(F_2\)得分1.437(高分),表明科研能力突出,但\(F_1\)得分0.525(中等),教学质量有待提升。

8.5.7 因子得分的注意事项

  • 标准化必要性:原始变量必须标准化后再计算得分,否则量纲差异会导致结果偏差。
  • 因子旋转影响:得分系数基于旋转后的因子载荷计算,不同旋转方法(如方差最大法、Promax)会导致得分差异。
  • 共同度依赖:变量共同度\(h_i^2\)过低(如<0.4)时,因子得分精度下降,需重新考虑因子提取效果。
  • 避免外推:因子得分基于样本数据估计,对样本外数据的预测需谨慎,建议结合专业知识。