第八章：因子分析¶

总览¶

一段话总结¶

因子分析是通过对研究变量的信息矩阵分析，找出少数综合变量（因子）解释多个可观测变量间复杂关系的方法。它源于Spearman对学生考试成绩的研究，主要有R型（对变量）和Q型（对样品）两种类型。其数学模型包含公共因子和特殊因子，因子载荷阵估计方法多样，如主成分法等。因子旋转可使因子含义更明确，还可通过最小二乘法、回归法等计算因子得分，在商业、体育、经济等多领域广泛应用，如分析企业形象评价、奥运会项目成绩、地区经济发展、消费者偏好等。

¶

详细总结¶

因子分析的起源与基本概念
- 起源：1904年Charles Spearman发表论文《对智力测验得分进行统计分析》，研究学生考试成绩，成为因子分析的起点。他发现学生各科考试成绩间存在某种潜在联系，提出最初的因子分析模型 \(X_{i}=a_{i}F+\varepsilon_{i}\)。
- 基本思想：通过分析研究变量的信息矩阵（协方差阵、相关系数矩阵或样品相似系数矩阵），找出少数几个不可观测的综合变量（因子），描述原始变量间的相关或相似关系。
- 类型：常用的因子分析类型是R型因子分析（对变量作因子分析）和Q型因子分析（对样品作因子分析），本章侧重讨论R型因子分析。
因子分析的数学模型
- 正交因子模型：用矩阵表示因子分析模型，将原始变量分解为公共因子和特殊因子两部分。
- 因子载荷的统计意义：因子载荷反映了原始变量与公共因子之间的相关程度。
- 变量共同度的统计意义：变量方差等于公共因子方差与特殊因子方差之和，即变量方差 = 共同度 + 剩余方差。方差贡献率是衡量公共因子相对重要程度的指标，方差贡献率越大，该公共因子越重要。
因子载荷阵的估计方法：有主成分法、主因子法、最小二乘法、极大似然法等多种方法，这些方法出发点不同，所得结果也不完全相同。以主成分法为例，通过计算可得到因子载荷阵，进而确定公共因子及其对原始变量的贡献。
因子旋转：因子载荷不唯一，为使因子含义更明确，Thurstone提出“简单结构”，旋转后的载荷矩阵每列元素平方值向0和1两极分化。凯泽提出相关方法，当公共因子数m>2时，可逐次对每两个公共因子进行旋转，使两列元素平方的相对方差之和达到最大。通过因子旋转，可使因子有更明确的含义，如在奥运会十项全能运动项目得分数据的因子分析中，旋转后得到短跑速度因子、爆发性臂力因子、爆发腿力因子和长跑耐力因子。
因子得分：计算因子得分的方法有最小二乘法和回归法等。在实际应用中，如对全国30个省市自治区的经济发展八项指标作因子分析时，通过SPSS软件操作，可得到因子得分系数矩阵，进而得到因子得分函数，生成样本标准化因子得分变量，用于对样品或变量进行评价和分类。
因子分析的应用案例
- 商业企业形象评价：消费者通过一系列指标评价百货商场，真正关心的是商店环境、商店服务和商品价格，这些潜在因素通过具体指标间接反映。
- 奥运会项目成绩分析：对奥运会十项全能运动项目得分数据进行因子分析，可找出影响运动员成绩的主要因子，如短跑速度因子、爆发性臂力因子等。
- 地区经济发展评估：对全国30个省市自治区的经济发展八项指标作因子分析，可提取总量因子、消费因子和价格因子，对各地区经济发展进行评价和分类。
- 消费者偏好研究：研究消费者对购买牙膏偏好的调查数据，通过因子分析可提取护牙因子和美牙因子，为牙膏生产企业开发新产品提供参考。

应用案例	分析内容	关键结果
商业企业形象评价	通过指标评价商场，找出潜在影响因素	潜在因素为商店环境、服务和价格
奥运会项目成绩分析	对十项全能项目得分进行因子分析	得到短跑速度、爆发性臂力等因子
地区经济发展评估	对30个省市自治区八项经济指标分析	提取总量、消费、价格因子
消费者偏好研究	分析消费者对牙膏偏好数据	提取护牙因子和美牙因子
---
### 关键问题
1. 因子分析中如何确定因子的个数？
- 答案：通常根据特征根和累计方差贡献率来确定。一般选取特征根大于1的因子，或者使累计方差贡献率达到一定比例（如70% - 85%以上）的因子个数。例如在研究消费者对购买牙膏偏好的调查数据时，提取两个因子累计方差贡献率就达到82%，第三个特征根相比下降较快，因此选取两个公共因子。
2. 因子分析与主成分分析的主要区别是什么？
- 答案：因子分析旨在用少数几个潜在变量（公共因子）解释多个显在变量中的复杂关系，每个原始变量分解为公共因子和特殊因子两部分；主成分分析是将多个指标化为少数几个互不相关的综合指标（主成分），主要用于数据降维。因子分析的因子通常是不可观测的，而主成分是原始变量的线性组合，是可观测的。
3. 在实际应用中，R型因子分析和Q型因子分析分别适用于哪些场景？
- 答案：R型因子分析适用于研究多个变量之间的相关性，找出影响这些变量的公共因子，如分析学生多门课程成绩之间的关系，找出潜在的影响因素（如学习能力等）；分析消费者对多种产品属性的评价数据，提取关键因子。Q型因子分析适用于对样品进行分类和综合评价，如对不同企业的经营数据进行分析，对企业进行分类；对不同地区的环境监测数据进行分析，找出相似的地区类别。
## 8.1 什么是因子分析
该节主要介绍了因子分析的基本概念，具体内容如下：

实际案例引入：以学生课程成绩和商业企业形象评价为例，说明实际中存在多个可观测变量受潜在因素影响的情况。学生课程成绩受学习能力等潜在共同因素影响，同时也受课程特点因素影响，如英语受语言能力影响。在商业企业形象评价中，消费者通过一系列指标评价商场，但真正关心商店环境、商店服务和商品价格，其中商店环境和服务质量需通过其他具体指标间接反映。
因子分析核心概念
- 定义：因子分析是利用少数几个潜在变量（公共因子）去解释多个显在变量（可观测变量）中存在的复杂关系。
- 变量分解：每个原始可观测变量可分解为两部分，一部分是公共因子，它是影响多个变量的共同因素；另一部分是特殊因子，是每个原始变量独自具有的因素，特殊因子的存在使不同原始变量有所区别。

8.1.1 Spearman的因子分析¶

研究背景与发现¶

Spearman对“高级预备学校”33名学生的古典语（C）、法语（F）、英语（E）、数学（M）、判别（D）和音乐（Mu）六门考试成绩相关性进行研究。通过分析相关阵，他发现不考虑对角元素时，任意两列元素大致成比例。如C列和E列对应元素比值近似相等，约为1.2 。

因子分析模型提出¶

基于上述发现，Spearman提出因子分析模型：\(X_{i}=a_{i}F+\varepsilon_{i}\) 。其中，\(X_{i}\)为第\(i\)门科目标准化后的考试成绩（均值为0，方差为1 ）；\(F\)是公共因子，对各科考试成绩均有影响，假设其均值为0，方差为1 ；\(\varepsilon_{i}\)是特殊因子，仅对第\(i\)门成绩有影响，假设均值为0且与\(F\)不相关。

求解方法¶

数据收集与相关阵计算：收集多门科目成绩数据，计算成绩之间的相关系数，构建相关阵。
观察相关阵特征：观察相关阵中列元素（非对角元素）是否大致成比例。
构建与验证模型：若存在列元素成比例现象，构建\(X_{i}=a_{i}F+\varepsilon_{i}\)模型，并通过协方差、方差等推导验证模型合理性，计算因子载荷\(a_{i}\)和共同度\(a_{i}^{2}\) 。

例子¶

假设有5名学生的语文（\(X_1\)）、数学（\(X_2\)）成绩数据如下（已标准化）： |学生|语文成绩|数学成绩| | ---- | ---- | ---- | |1|0.5|0.4| |2|-0.3| -0.2| |3|0.8|0.6| |4|-0.1| -0.1| |5|0.4|0.3|

计算相关阵
计算语文和数学成绩的协方差\(Cov(X_1,X_2)\) ：
- 均值\(\bar{X_1}=\frac{0.5 - 0.3 + 0.8 - 0.1 + 0.4}{5}=0.26\) ，\(\bar{X_2}=\frac{0.4 - 0.2 + 0.6 - 0.1 + 0.3}{5}=0.24\) 。
- \(Cov(X_1,X_2)=\frac{1}{5}\sum_{k = 1}^{5}(X_{1k}-\bar{X_1})(X_{2k}-\bar{X_2})=\frac{(0.5 - 0.26)(0.4 - 0.24)+(-0.3 - 0.26)(-0.2 - 0.24)+(0.8 - 0.26)(0.6 - 0.24)+(-0.1 - 0.26)(-0.1 - 0.24)+(0.4 - 0.26)(0.3 - 0.24)}{5}=0.096\) 。
语文成绩方差\(Var(X_1)=\frac{1}{5}\sum_{k = 1}^{5}(X_{1k}-\bar{X_1})^2 = 0.1624\) ，数学成绩方差\(Var(X_2)=\frac{1}{5}\sum_{k = 1}^{5}(X_{2k}-\bar{X_2})^2 = 0.1224\) 。
相关系数\(r_{12}=\frac{Cov(X_1,X_2)}{\sqrt{Var(X_1)Var(X_2)}}=\frac{0.096}{\sqrt{0.1624\times0.1224}}\approx0.69\) ，相关阵为\(\begin{bmatrix}1&0.69\\0.69&1\end{bmatrix}\) 。
观察相关阵特征：由于只有两门科目，可简单看相关系数体现的相关性。这里相关系数为0.69 ，说明存在一定关联。
构建模型并计算
假设符合\(X_{i}=a_{i}F+\varepsilon_{i}\)模型。设\(F\)为学习能力公共因子，\(\varepsilon_{1}\)、\(\varepsilon_{2}\)为语文和数学各自特殊因子。
由\(Cov(X_1,X_2)=a_1a_2 = 0.096\) ，假设\(a_1 = 0.4\) ，则\(a_2=\frac{0.096}{0.4}=0.24\) 。
对于语文，根据\(1 = a_{1}^{2}+Var(\varepsilon_{1})\) ，可得\(Var(\varepsilon_{1})=1 - 0.4^2 = 0.84\) ，共同度\(a_{1}^{2}=0.16\) ；对于数学，\(Var(\varepsilon_{2})=1 - 0.24^2 = 0.9424\) ，共同度\(a_{2}^{2}=0.0576\) 。

8.1.2 因子分析的基本思想¶

核心目标：通过分析变量的信息矩阵（如协方差阵、相关系数矩阵），找出控制所有原始变量的少数综合变量（因子），描述变量间的相关关系。
因子性质：这些综合变量不可观测，是抽象的潜在变量。
主要类型：
- R型因子分析：针对变量进行分析。
- Q型因子分析：针对样品进行分析，本章侧重R型。
应用方向：
- 将复杂变量综合为少数因子，呈现变量与因子的结构关系。
- 基于因子对样品或变量进行评价与分类。

8.1.3 因子分析的数学模型初探¶

变量分解：每个可观测变量受公共因子和特殊因子共同影响。如学生课程成绩受“学习能力”等公共因子影响，也受“语言能力”“推理能力”等特殊因子影响。
潜在变量与可测变量关系：潜在变量（如商店环境、服务质量）需通过可测指标（如装修评分、服务态度评分）间接反映。

8.1.4 因子分析的典型案例¶

Spearman关于智力的研究¶

研究对象：33名学生的六门课程成绩（古典语C、法语F、英语E、数学M、判别D、音乐Mu）。
数据处理：
- 计算六门课程成绩的相关矩阵，发现非对角元素大致成比例。如C列和E列元素比例关系近似成立。
模型建立：
- 提出模型：\(X_i = a_iF + \varepsilon_i\)，其中\(X_i\)为第\(i\)门课程成绩，\(F\)为公共因子（如一般智力），\(a_i\)为因子载荷，\(\varepsilon_i\)为特殊因子。
结论：该模型表明各科成绩可由一个公共因子和自身特殊因子解释，验证了因子分析的可行性。

商业企业形象评价案例¶

可测指标：消费者通过一系列具体指标评价百货商场。
潜在因子：实际关心的“商店环境”“商店服务”“商品价格”等抽象因子，需通过具体指标间接反映。

沉积学研究案例¶

研究问题：1957年Krumbren在沉积学研究中应用因子分析方法。
分析逻辑：通过因子分析处理多个沉积学相关变量，提取潜在的控制因子，揭示地质现象的内在关系。

8.2 因子分析的数学模型¶

8.2.1 正交因子模型的基本形式¶

数学表达式：
设\(X=(X_1,X_2,\dots,X_p)^T\)为可观测变量向量，\(F=(F_1,F_2,\dots,F_m)^T\)为公共因子向量，\(\varepsilon=(\varepsilon_1,\varepsilon_2,\dots,\varepsilon_p)^T\)为特殊因子向量，则因子分析模型可表示为：
[ \begin{cases} X_1 = a_{11}F_1 + a_{12}F_2 + \dots + a_{1m}F_m + \varepsilon_1 \ X_2 = a_{21}F_1 + a_{22}F_2 + \dots + a_{2m}F_m + \varepsilon_2 \ \vdots \ X_p = a_{p1}F_1 + a_{p2}F_2 + \dots + a_{pm}F_m + \varepsilon_p \end{cases} ]
其中\(a_{ij}\)为因子载荷，衡量第\(i\)个变量与第\(j\)个公共因子的相关程度。
模型假设：
公共因子\(F\)与特殊因子\(\varepsilon\)不相关，即\(\text{Cov}(F,\varepsilon)=0\)。
公共因子之间正交且方差为1，即\(\text{Cov}(F_i,F_j)=0\)（\(i\neq j\)），\(\text{Var}(F_j)=1\)。
特殊因子方差为\(\psi_i^2\)，即\(\text{Var}(\varepsilon_i)=\psi_i^2\)，且不同特殊因子之间不相关。

8.2.2 矩阵形式与参数定义¶

矩阵表示：
模型可简写为：
[ X = AF + \varepsilon ]
其中\(A=(a_{ij})_{p \times m}\)为因子载荷阵，\(F\)和\(\varepsilon\)为列向量。
协方差结构：
若\(\text{Cov}(F)=\text{I}_m\)（单位矩阵），\(\text{Cov}(\varepsilon)=\Psi=\text{diag}(\psi_1^2,\psi_2^2,\dots,\psi_p^2)\)，则变量的协方差阵为：
[ \Sigma = A A^T + \Psi ]

8.2.3 因子载荷的统计意义¶

相关系数解释：
因子载荷\(a_{ij}\)表示变量\(X_i\)与公共因子\(F_j\)的相关系数，即：
[ a_{ij} = \text{Corr}(X_i, F_j) ]
例：若\(a_{11}=0.8\)，则变量\(X_1\)与因子\(F_1\)的线性相关性为0.8，说明\(F_1\)对\(X_1\)的影响较强。
方差贡献分解：
变量\(X_i\)的方差可分解为公共因子方差与特殊因子方差之和：
[ \text{Var}(X_i) = \sum_{j=1}^m a_{ij}^2 + \psi_i^2 ]
其中\(\sum_{j=1}^m a_{ij}^2\)称为变量\(X_i\)的共同度（Communality），记为\(h_i^2\)，表示公共因子解释\(X_i\)方差的比例；\(\psi_i^2\)为剩余方差，由特殊因子解释。

8.2.4 变量共同度与方差贡献率¶

共同度的意义：
共同度\(h_i^2\)越接近1，说明公共因子对变量\(X_i\)的解释力越强。例如，若\(h_1^2=0.7\)，则\(X_1\)的70%方差可由公共因子解释，剩余30%由特殊因子解释。
方差贡献率：
第\(j\)个公共因子\(F_j\)的方差贡献率定义为：
[ \text{贡献率}j = \frac{\sum ]}^p a_{ij}^2}{p
该指标衡量\(F_j\)对所有变量的综合影响程度，贡献率越大，因子越重要。累计方差贡献率则为前\(k\)个因子的贡献率之和，用于确定因子个数（如累计贡献率达80%以上时认为因子提取充分）。

8.2.5 案例：Spearman智力研究的因子模型¶

问题背景：Spearman对33名学生的6门课程成绩（古典语C、法语F、英语E、数学M、判别D、音乐Mu）进行因子分析，假设成绩由一个公共因子\(F\)（一般智力）和特殊因子\(\varepsilon_i\)构成。
模型构建：
以英语成绩\(E\)和数学成绩\(M\)为例，模型可表示为：
[ \begin{cases} E = a_E F + \varepsilon_E \ M = a_M F + \varepsilon_M \end{cases} ]
根据相关矩阵，\(\text{Corr}(E,M)=0.64\)，由因子模型可得：
[ \text{Corr}(E,M) = a_E a_M \quad (\text{因} \text{Var}(F)=1, \text{Cov}(\varepsilon_E,\varepsilon_M)=0) ]
若假设\(a_E=0.8\)，\(a_M=0.8\)，则\(\text{Corr}(E,M)=0.64\)，与实际数据一致。
共同度计算：
英语成绩的共同度\(h_E^2 = a_E^2 = 0.8^2 = 0.64\)，表示一般智力因子解释了英语成绩64%的方差，剩余36%由英语特有的能力（如语言理解）等特殊因子解释。
方差贡献率：
单个公共因子的方差贡献率为\(\frac{\sum_{i=1}^6 a_i^2}{6}\)。若各课程的因子载荷均为0.8，则贡献率为\(\frac{6 \times 0.8^2}{6} = 0.64\)，即该因子解释了所有课程成绩64%的总方差。

8.2.6 模型拓展：多因子案例¶

商业企业形象评价模型：
设消费者对商场的评价变量为\(X_1\)（装修评分）、\(X_2\)（服务态度评分）、\(X_3\)（商品价格评分），潜在因子为\(F_1\)（环境因子）、\(F_2\)（服务因子），则模型为：
[ \begin{cases} X_1 = a_{11}F_1 + a_{12}F_2 + \varepsilon_1 \ X_2 = a_{21}F_1 + a_{22}F_2 + \varepsilon_2 \ X_3 = a_{31}F_1 + a_{32}F_2 + \varepsilon_3 \end{cases} ]
若\(a_{11}=0.9\)，\(a_{12}=0.1\)，则\(X_1\)主要受\(F_1\)（环境因子）影响；若\(a_{22}=0.8\)，则\(X_2\)主要受\(F_2\)（服务因子）影响。
共同度与贡献率计算：
变量\(X_1\)的共同度\(h_1^2 = 0.9^2 + 0.1^2 = 0.82\)，说明环境和服务因子共解释了\(X_1\)82%的方差。
若\(F_1\)的载荷平方和为\(0.9^2 + 0.2^2 + 0.3^2 = 0.94\)，则\(F_1\)的方差贡献率为\(\frac{0.94}{3} \approx 0.313\)（31.3%），\(F_2\)的贡献率可类似计算。

8.3 因子载荷阵的估计方法¶

8.3.1 主成分法（Principal Components Method）¶

方法原理与步骤¶

核心思想：通过主成分分析提取变量的主要变异方向，将主成分转化为因子载荷阵，适用于初始因子提取。
具体步骤：
计算相关矩阵：对可观测变量\(X_1, X_2, \dots, X_p\)计算样本相关矩阵\(R\)。
求解特征值与特征向量：计算\(R\)的特征值\(\lambda_1 \geq \lambda_2 \geq \dots \geq \lambda_p \geq 0\)及对应的单位特征向量\(\gamma_1, \gamma_2, \dots, \gamma_p\)。
确定公共因子个数\(m\)：通常选取累计方差贡献率达80%以上的前\(m\)个特征值。
构造因子载荷阵：第\(i\)个变量在第\(j\)个公共因子上的载荷为\(a_{ij} = \gamma_{ij} \sqrt{\lambda_j}\)，其中\(\gamma_{ij}\)为第\(j\)个特征向量的第\(i\)个分量。
与主成分分析的联系：
主成分分析模型为\(Y_j = \sum_{i=1}^p \gamma_{ij} X_i\)，而因子分析模型可视为主成分的逆过程，通过\(X_i = \sum_{j=1}^m a_{ij} F_j + \varepsilon_i\)实现变量分解。

案例：Spearman智力研究的主成分法应用¶

数据背景：33名学生6门课程成绩的相关矩阵（部分数据）：
| | E | M | D | Mu | |---|---|---|---|---| | E | 1 | 0.64 | 0.54 | 0.51 | | M | 0.64 | 1 | 0.45 | 0.51 | | D | 0.54 | 0.45 | 1 | 0.40 | | Mu| 0.51 | 0.51 | 0.40 | 1 |
计算步骤：
计算相关矩阵特征值：假设前1个特征值\(\lambda_1 = 3.2\)，对应特征向量\(\gamma_1 = (0.7, 0.6, 0.5, 0.5)^T\)（以E、M、D、Mu为例）。
计算因子载荷：
\(a_{ij} = \gamma_{ij} \sqrt{\lambda_1}\)，如：
- 英语（E）的载荷：\(a_{E1} = 0.7 \times \sqrt{3.2} \approx 0.7 \times 1.789 \approx 1.252\)
- 数学（M）的载荷：\(a_{M1} = 0.6 \times \sqrt{3.2} \approx 1.073\)
构建因子模型：
\(X_i = a_{i1}F_1 + \varepsilon_i\)，即各科成绩由公共因子\(F_1\)（一般智力）和特殊因子\(\varepsilon_i\)构成。
结果解释：
因子载荷反映变量与公共因子的相关性，如英语成绩与\(F_1\)的相关系数约为1.252（标准化后），说明一般智力对英语成绩的影响较强。

8.3.2 主因子法（Principal Factor Method，主轴因子法）¶

方法原理与步骤¶

核心思想：考虑变量的特殊因子方差，通过“约相关矩阵”提取因子，适用于共同度已知或可估计的场景。
具体步骤：
初始共同度估计：
- 常用方法：\(h_i^2 = \text{Var}(X_i) - \psi_i^2\)，初始值可设为\(h_i^2 = \max|R_{ij}|^2\)（\(R_{ij}\)为相关系数），或直接取1（假设特殊因子方差为0）。
构造约相关矩阵：
约相关矩阵\(R^* = (r_{ij}^*)\)，其中\(r_{ii}^* = h_i^2\)，\(r_{ij}^* = r_{ij}\)（\(i \neq j\)）。
求解约相关矩阵的特征值与特征向量：得到特征值\(\lambda_j^*\)和特征向量\(\gamma_j^*\)。
计算因子载荷：\(a_{ij} = \gamma_{ij}^* \sqrt{\lambda_j^*}\)。
迭代更新共同度：
计算新的共同度\(h_i^2 = \sum_{j=1}^m a_{ij}^2\)，重复步骤2-4直至共同度收敛（变化小于阈值）。
与主成分法的区别：
主成分法假设\(h_i^2 = 1\)（忽略特殊因子），而主因子法通过迭代估计真实共同度，更贴近实际模型。

案例：十项全能运动项目的主因子法应用¶

数据背景：奥运会十项全能项目（百米跑、跳远、铅球等10项成绩）的相关矩阵，需提取公共因子。
计算步骤：
初始共同度估计：假设各变量初始共同度\(h_i^2 = 0.8\)（经验值）。
构造约相关矩阵：对角元素设为0.8，非对角元素保留原始相关系数（如百米跑与跳远的相关系数\(r=0.7\)，则\(r^*=0.7\)）。
特征值分析：计算约相关矩阵的前2个特征值\(\lambda_1^*=4.5\)，\(\lambda_2^*=2.3\)，对应特征向量：
\(\gamma_1^* = (0.8, 0.7, 0.3, \dots)^T\)，\(\gamma_2^* = (0.2, 0.1, 0.8, \dots)^T\)（以部分项目为例）。
计算因子载荷：
- 百米跑在\(F_1\)的载荷：\(a_{11} = 0.8 \times \sqrt{4.5} \approx 0.8 \times 2.121 \approx 1.697\)
- 铅球在\(F_2\)的载荷：\(a_{32} = 0.8 \times \sqrt{2.3} \approx 0.8 \times 1.517 \approx 1.214\)
迭代更新共同度：
首次计算的共同度\(h_1^2 = 1.697^2 \approx 2.88\)（超过1，需标准化），调整后重新计算约相关矩阵，直至\(h_i^2\)稳定在合理范围（如0.6-0.9）。
结果解释：
因子\(F_1\)在速度类项目（百米跑、跳远）上载荷高，可命名为“速度因子”；\(F_2\)在力量类项目（铅球、铁饼）上载荷高，可命名为“力量因子”。

8.3.3 其他估计方法概述¶

最小二乘法（Least Squares）：
目标是最小化观测协方差阵与模型协方差阵的差异，即\(\min \|R - (AA^T + \Psi)\|^2\)，通过迭代求解\(A\)和\(\Psi\)。
极大似然法（Maximum Likelihood）：
假设变量服从多元正态分布，通过最大化似然函数估计参数，需满足\(R = AA^T + \Psi\)，适用于大样本数据。
因子提取法对比：
| 方法 | 核心假设 | 优点 | 适用场景 | |--------------|------------------------------|--------------------------|--------------------------| | 主成分法 | 忽略特殊因子（\(\Psi=0\)） | 计算简单，无需迭代 | 探索性分析，初始因子提取 | | 主因子法 | 考虑特殊因子，迭代估计共同度 | 贴近真实模型 | 需精确共同度的场景 | | 极大似然法 | 变量服从正态分布 | 统计性质优良 | 大样本、理论推断 |

8.3.4 案例：主成分法与主因子法的结果对比¶

数据场景：某地区5项经济指标（GDP、消费、投资等）的相关矩阵，使用主成分法和主因子法提取2个公共因子。
结果差异：
| 方法 | 因子1载荷（GDP） | 因子2载荷（投资） | 共同度（GDP） | |------------|------------------|------------------|---------------| | 主成分法 | 0.92 | 0.31 | 0.92²=0.85 | | 主因子法 | 0.87 | 0.45 | 0.87²+0.45²=0.93 |
原因分析：
主因子法通过迭代考虑了特殊因子方差，使共同度更高，因子载荷更聚焦于公共因子的解释力，而主成分法因忽略特殊因子，可能高估公共因子的贡献。

8.4 因子旋转¶

8.4.1 因子旋转的本质与目的¶

因子载荷的不唯一性：
若\(A\)是因子载荷阵，\(T\)为正交矩阵，则\(AT\)也是合法的载荷阵，即因子解不唯一。例如：
[ X = AF + \varepsilon = (AT)(T^TF) + \varepsilon ]
其中\(T^TF\)是新的公共因子向量，与原因子正交。
旋转的核心目标：
通过正交或斜交变换，使因子载荷矩阵的结构简化，实现“简单结构”——载荷值向0和1两极分化，便于因子命名与解释。

8.4.2 正交旋转（Orthogonal Rotation）¶

方差最大法（Varimax）¶

Thurstone简单结构原则：
旋转后每个变量仅在一个因子上有高载荷，在其他因子上载荷接近0；每个因子应至少在几个变量上有高载荷，避免因子无实际意义。
Kaiser方差最大法步骤：
目标函数：最大化各因子载荷平方的相对方差，公式为：
[ V = \frac{1}{p} \sum_{j=1}^m \left[ \sum_{i=1}^p (a_{ij}^2 / h_i²⁾2 - \frac{1}{p} \left( \sum_{i=1}^p a_{ij}^2 / h_i^2 \right)^2 \right] ]
其中\(h_i^2\)为变量共同度，最大化\(V\)可使载荷矩阵每列元素平方值尽可能集中于0或1。
正交变换矩阵：
对第\(l\)和\(k\)个因子，旋转矩阵\(T\)为：
[ T = \begin{pmatrix} \cos\theta & \sin\theta \ -\sin\theta & \cos\theta \end{pmatrix} ]
角度\(\theta\)由下式确定：
[ \tan4\theta = \frac{2\sum_{i=1}^p (a_{il}^2 - a_{ik}^{2)(a_{il}a_{ik}/h_i}2)}{\sum_{i=1}^p (a_{il}^4 + a_{ik}^4 - 2(a_{il}a_{ik}/h_i²⁾2)} ]
逐次旋转：对\(m\)个因子逐对旋转（如先旋转\(F_1\)与\(F_2\)，再旋转\(F_1\)与\(F_3\)等），直至\(V\)收敛。

案例：十项全能运动项目的方差最大旋转¶

原始数据：10项运动成绩（百米跑、跳远等）的初始因子载荷矩阵显示第一因子在所有项目上载荷均较高，其他因子难以解释。
旋转前载荷矩阵（部分）：
| 项目 | 因子1 | 因子2 | |------------|-------|-------| | 百米跑 | 0.78 | 0.32 | | 铅球 | 0.56 | 0.61 | | 1500米跑 | 0.65 | 0.43 |
旋转后载荷矩阵（部分）：
| 项目 | 因子1（速度） | 因子2（力量） | |------------|---------------|---------------| | 百米跑 | 0.92 | 0.11 | | 铅球 | 0.15 | 0.89 | | 1500米跑 | 0.85 | 0.23 |
解释与命名：
旋转后因子1在速度类项目（百米跑、1500米跑）上载荷高，命名为“速度耐力因子”；因子2在力量类项目（铅球）上载荷高，命名为“爆发力量因子”。

8.4.3 斜交旋转（Oblique Rotation）¶

Promax法¶

适用场景：当公共因子间存在相关性时，斜交旋转允许因子相关，更贴近实际数据结构。
核心步骤：
先进行正交旋转（如方差最大法）得到正交因子载荷阵\(A\)。
构造斜交因子：通过幂变换生成斜交因子，公式为：
[ a_{ij}^* = a_{ij} / |a_{ij}|^\delta \quad (\delta \geq 1，通常取2) ]
变换后因子间相关系数\(\Phi_{jk} = \sum_{i=1}^p a_{ij}^* a_{ik}^* / p\)。
标准化处理：确保因子方差为1，最终得到斜交载荷阵。
与正交旋转的对比：
| 方法 | 因子相关性 | 共同度变化 | 解释难度 | |------------|------------|------------|----------| | 正交旋转 | 不相关 | 不变 | 简单 | | 斜交旋转 | 相关 | 可能改变 | 复杂但更真实 |

案例：消费者牙膏偏好调查的斜交旋转¶

原始因子：正交旋转后得到“护牙因子”和“美牙因子”，假设实际中两者可能存在相关性（如注重护牙的消费者也可能关注美牙）。
Promax旋转步骤：
正交旋转后的载荷阵（部分）：
| 陈述 | 因子1（护牙） | 因子2（美牙） | |--------------|---------------|---------------| | “预防蛀牙” | 0.96 | 0.02 | | “牙齿亮泽” | 0.05 | 0.85 |
幂变换（\(\delta=2\)）：
[ a_{ij}^* = a_{ij} / |a_{ij}|^2 = 1 / |a_{ij}| \quad (a_{ij} \neq 0) ]
如“预防蛀牙”在因子1的载荷变为\(1/0.96 \approx 1.04\)，因子2的载荷变为\(1/0.02 = 50\)（实际计算中会标准化）。
计算因子相关系数：
\(\Phi_{12} = \sum_{i=1}^6 a_{i1}^* a_{i2}^* / 6 \approx 0.35\)，表明护牙与美牙因子存在中等程度相关。
结果意义：
斜交旋转后因子更符合现实逻辑（护牙与美牙并非完全独立），但解释时需同时考虑因子间相关性。

8.4.4 旋转效果评估与因子命名¶

评估指标：
载荷矩阵结构：高载荷（绝对值>0.5）与低载荷（绝对值<0.3）的区分度是否明显。
因子可解释性：能否根据高载荷变量赋予因子合理名称（如“学习能力因子”“消费习惯因子”等）。
累计方差贡献率：旋转不改变累计贡献率，但可能使各因子贡献率重新分配。
命名原则：
高载荷变量聚类：将载荷>0.5的变量归类，提取共同特征。
避免主观偏差：基于变量实际含义而非预设理论命名。
简洁性：名称需概括因子核心维度（如“科技创新因子”而非“企业研发投入与技术转化能力因子”）。

8.4.5 SPSS操作示例：方差最大旋转¶

步骤解析：
在因子分析对话框中点击“Rotation”按钮，选择“Varimax”（方差最大法）。
勾选“Rotated solution”和“Loading plot(s)”（载荷图）。
输出结果包括旋转后的因子载荷矩阵、因子转换矩阵（\(T\)）和载荷散点图。
案例输出解读：
某经济指标数据旋转后，因子1在“GDP”“工业总产值”上载荷>0.9，命名为“经济总量因子”；因子2在“居民消费价格指数”上载荷>0.8，命名为“通货膨胀因子”。

8.4.6 特殊旋转方法拓展¶

四次方最大法（Quartimax）：
目标是最大化每行载荷平方的方差，使每个变量仅在少数因子上有高载荷，适用于减少每个变量关联的因子数。
** equamax法**：
同时考虑行和列的方差最大化，介于方差最大法和四次方最大法之间，平衡因子和变量的简化程度。
直接斜交法（Direct Oblimin）：
通过参数\(\delta\)控制因子相关程度，\(\delta=0\)时等价于正交旋转，\(\delta\)越大因子相关性越强。

8.5 因子得分¶

8.5.1 因子得分的定义与作用¶

定义：因子得分是将公共因子表示为原始可观测变量的线性组合，即通过\(F_j = \sum_{i=1}^p w_{ij}X_i\)（\(j=1,2,\dots,m\)）计算每个样本在公共因子上的取值，其中\(w_{ij}\)为因子得分系数。
核心作用：
降维表示：用少数因子得分代替原始变量，便于可视化和聚类分析。
样本评价：基于因子得分对样本（如地区、消费者）进行排名或分类。
后续分析：作为新变量输入回归、聚类等模型，挖掘数据深层结构。

8.5.2 最小二乘法（Least Squares）¶

方法原理与推导¶

目标函数：通过最小化因子估计值与真实值的误差平方和，即\(\min \sum_{k=1}^n (F_{jk} - \hat{F}_{jk})^2\)，其中\(n\)为样本数。
基本假设：假设因子\(F\)与变量\(X\)满足线性关系，忽略特殊因子影响（\(\varepsilon \approx 0\)）。
求解步骤：
标准化原始变量：将\(X_i\)转化为\(Z_i = (X_i - \bar{X}_i)/s_i\)，消除量纲影响。
构建因子模型：\(Z = AF\)（假设\(\varepsilon=0\)），其中\(A\)为标准化后的因子载荷阵。
求解系数矩阵：因子得分系数\(W = (A^TA)^{-1}A^T\)，即\(F = WZ\)。

案例：全国30省市经济指标因子得分计算¶

数据背景：8项经济指标（GDP、居民消费水平等）的因子分析，提取2个公共因子\(F_1\)（总量因子）、\(F_2\)（消费因子）。
计算步骤：
标准化数据：如北京GDP为\(X_1=30000\)亿元，均值\(\bar{X}_1=15000\)，标准差\(s_1=8000\)，则\(Z_1=(30000-15000)/8000=1.875\)。
因子载荷阵（标准化后）：
| 指标 | \(F_1\) | \(F_2\) | |------------|--------|--------| | GDP（\(Z_1\)） | 0.94 | 0.13 | | 居民消费水平（\(Z_2\)） | 0.21 | 0.84 |
计算得分系数：
[ W = (A^TA) 0.31 & 0.01 \ 0.04 & 0.38 \end{pmatrix} ] }A^T = \begin{pmatrix
计算因子得分：
北京的因子得分为：
[ \begin{cases} F_1 = 0.31 \times 1.875 + 0.01 \times Z_2 \approx 0.581 \ F_2 = 0.04 \times 1.875 + 0.38 \times Z_2 \quad (\text{假设} Z_2=1.5 \text{时，} F_2 \approx 0.63) \end{cases} ]
结果解释：北京的\(F_1\)得分0.581（高于均值），表明其经济总量指标表现较好；\(F_2\)得分0.63，消费因子表现中等。

8.5.3 回归法（Regression Method）¶

方法原理与推导¶

核心思想：考虑因子与变量的统计相关性，通过回归模型估计因子得分，由Thomson（1951）提出，又称Thomson法。
数学推导：
假设因子\(F\)与变量\(X\)的协方差为\(\text{Cov}(F,X)=A\)，且\(\text{Var}(F)=I\)，\(\text{Var}(X)=AA^T+\Psi\)。根据回归理论，因子得分的最优线性无偏估计为：
[ \hat{F} = A^T(AAT+\Psi)^{-1}X ]
当变量标准化且\(\Psi\)近似为对角阵时，简化为：
[ \hat{F} = A^TRX ]
其中\(R\)为相关矩阵。
SPSS实现：默认采用回归法计算因子得分，输出因子得分系数矩阵，得分公式为\(F_j = \sum_{i=1}^p w_{ij}Z_i\)，其中\(w_{ij}\)为系数矩阵元素。

案例：消费者牙膏偏好的因子得分计算¶

数据背景：6项牙膏属性评分（V1-V6），提取2个因子\(F_1\)（护牙因子）、\(F_2\)（美牙因子），旋转后载荷矩阵如下：
| 陈述 | \(F_1\) | \(F_2\) | |------------|--------|--------| | V1（预防蛀牙） | 0.96 | -0.02 | | V2（牙齿亮泽） | -0.05 | 0.85 |
SPSS操作步骤：
在因子分析对话框中点击“Scores”按钮，选择“Regression”法，勾选“Save as variables”。
输出因子得分系数矩阵（部分）：
| 变量 | \(F_1\)系数 | \(F_2\)系数 | |------------|------------|------------| | V1（标准化后） | 0.23 | -0.01 | | V2（标准化后） | -0.01 | 0.21 |
得分计算示例：某消费者的标准化评分\(Z_1=1.2\)（V1），\(Z_2=0.8\)（V2），则：
[ \begin{cases} F_1 = 0.23 \times 1.2 + (-0.01) \times 0.8 \approx 0.27 \ F_2 = (-0.01) \times 1.2 + 0.21 \times 0.8 \approx 0.16 \end{cases} ]
结果应用：该消费者的\(F_1\)得分0.27（高于均值），表明更关注护牙属性；\(F_2\)得分0.16，对美牙属性关注度中等，可归为“护牙主导型”消费者。

8.5.4 因子得分的性质与应用¶

基本性质¶

均值与方差：
因子得分的均值为0，即\(\bar{F}_j = 0\)。
得分的方差小于等于1，且因子间的协方差等于因子相关系数（斜交旋转时）。
与原始变量的关系：
因子得分与原始变量的相关系数为\(\text{Corr}(F_j,X_i) = a_{ij} / \sqrt{h_i^2}\)，其中\(a_{ij}\)为因子载荷，\(h_i^2\)为共同度。

典型应用场景¶

样本分类与评价：
以全国省市经济数据为例，根据因子得分绘制散点图，将北京、上海等\(F_1\)高分地区归为“经济发达型”，甘肃、青海等低分地区归为“经济欠发达型”。
动态趋势分析：
对同一地区不同年份的因子得分进行时序分析，如某省2020-2025年的\(F_1\)得分从0.3升至0.7，表明经济总量持续增长。
与其他模型结合：
将因子得分作为自变量输入回归模型，如研究“经济总量因子”与“就业率”的关系，避免原始变量多重共线性问题。

8.5.5 其他因子得分方法¶

Bartlett法：
假设因子与变量满足多元正态分布，通过极大似然估计得分，公式为\(\hat{F} = (A^T\Psi^{-1}A)^{-1}A^T\Psi^{-1}X\)，适用于小样本场景。
Anderson-Rubin法：
保证因子得分的正交性和方差为1，通过迭代求解使\(\hat{F}^T\hat{F}=I\)，常用于理论推导。
方法对比：
| 方法 | 假设条件 | 优点 | 适用场景 | |------------|------------------------------|--------------------------|--------------------------| | 最小二乘法 | 忽略特殊因子 | 计算简单 | 探索性分析 | | 回归法 | 考虑因子与变量相关性 | 统计性质优良 | 精确评价与推断 | | Bartlett法 | 变量服从正态分布 | 小样本下效率高 | 理论研究 |

8.5.6 SPSS实操与结果解读¶

操作流程¶

菜单选择：Analyze → Data Reduction → Factor，将变量移入列表。
得分设置：点击“Scores”按钮，选择“Regression”法，勾选“Display factor score coefficient matrix”。
结果输出：
因子得分系数矩阵：直接用于计算得分函数。
新变量存储：生成如“FAC1_1”“FAC2_1”的因子得分变量，可在数据视图中查看。

案例结果解读¶

系数矩阵示例：某教育指标因子分析的得分系数矩阵：
| 指标 | \(F_1\)（教学质量） | \(F_2\)（科研能力） | |------------|---------------------|---------------------| | 师生比（\(Z_1\)） | 0.45 | 0.12 | | 论文数（\(Z_2\)） | 0.11 | 0.89 |
得分计算：某高校\(Z_1=0.8\)，\(Z_2=1.5\)，则：
[ \begin{cases} F_1 = 0.45 \times 0.8 + 0.11 \times 1.5 = 0.525 \ F_2 = 0.12 \times 0.8 + 0.89 \times 1.5 = 1.437 \end{cases} ]
评价结论：该高校\(F_2\)得分1.437（高分），表明科研能力突出，但\(F_1\)得分0.525（中等），教学质量有待提升。

8.5.7 因子得分的注意事项¶

标准化必要性：原始变量必须标准化后再计算得分，否则量纲差异会导致结果偏差。
因子旋转影响：得分系数基于旋转后的因子载荷计算，不同旋转方法（如方差最大法、Promax）会导致得分差异。
共同度依赖：变量共同度\(h_i^2\)过低（如<0.4）时，因子得分精度下降，需重新考虑因子提取效果。
避免外推：因子得分基于样本数据估计，对样本外数据的预测需谨慎，建议结合专业知识。

第八章：因子分析¶

总览¶

一段话总结¶

¶

详细总结¶

8.1.1 Spearman的因子分析¶

研究背景与发现¶

因子分析模型提出¶

相关推导与重要指标¶

求解方法¶

例子¶

8.1.2 因子分析的基本思想¶

8.1.3 因子分析的数学模型初探¶

8.1.4 因子分析的典型案例¶

Spearman关于智力的研究¶

商业企业形象评价案例¶

沉积学研究案例¶

8.2 因子分析的数学模型¶

8.2.1 正交因子模型的基本形式¶

8.2.2 矩阵形式与参数定义¶

8.2.3 因子载荷的统计意义¶

8.2.4 变量共同度与方差贡献率¶

8.2.5 案例：Spearman智力研究的因子模型¶

8.2.6 模型拓展：多因子案例¶

8.3 因子载荷阵的估计方法¶

8.3.1 主成分法（Principal Components Method）¶

方法原理与步骤¶

案例：Spearman智力研究的主成分法应用¶

8.3.2 主因子法（Principal Factor Method，主轴因子法）¶

方法原理与步骤¶

案例：十项全能运动项目的主因子法应用¶

8.3.3 其他估计方法概述¶

8.3.4 案例：主成分法与主因子法的结果对比¶

8.4 因子旋转¶

8.4.1 因子旋转的本质与目的¶

8.4.2 正交旋转（Orthogonal Rotation）¶

方差最大法（Varimax）¶

案例：十项全能运动项目的方差最大旋转¶

8.4.3 斜交旋转（Oblique Rotation）¶

Promax法¶

案例：消费者牙膏偏好调查的斜交旋转¶

8.4.4 旋转效果评估与因子命名¶

8.4.5 SPSS操作示例：方差最大旋转¶

8.4.6 特殊旋转方法拓展¶

8.5 因子得分¶

8.5.1 因子得分的定义与作用¶

8.5.2 最小二乘法（Least Squares）¶

方法原理与推导¶

案例：全国30省市经济指标因子得分计算¶

8.5.3 回归法（Regression Method）¶

方法原理与推导¶

案例：消费者牙膏偏好的因子得分计算¶

8.5.4 因子得分的性质与应用¶

基本性质¶

典型应用场景¶

8.5.5 其他因子得分方法¶

8.5.6 SPSS实操与结果解读¶

操作流程¶

案例结果解读¶

8.5.7 因子得分的注意事项¶