写在前面:
探索性因子分析:基于降维的思想,将错综复杂的众多变量聚合成少数几个独立的公共因子,在乎的是多个测试项是否能组成一个或多个理论变量,其理论变量是未知的,例如 30 个题目里面能生成多少个理论变量,即最合适的因子个数是多少。
验证性因子分析:事前已知理论变量,强调多个测试项是否能否代表某个理论变量,例如检验购买频率、主观评估、消费比例是否真的可以反映忠诚度。也就是我们预先的理论架构是否是好的,题目设置是否是好的,收集到的数据能否体现想要的结果,实际上也就是一种效度检验。
探索性因子分析更适合于在没有理论支持的情况下对数据的试探性分析。验证性因子分析充分利用了先验信息,在已知因子的情况下检验所搜集的数据资料是否按事先预定的结构方式产生作用。
同时,两种因子分析缺少任何一个,因子分析都将是不完整的 。一般来说,如果研究者没有
坚实的理论基础支撑,有关观测变量内部结构一般先用探索性因子分析,产生一个关于内部结构的理论,再在此基础上用验证性因子分析,这样的做法是比较科学的,但这必须要用两组分开的数据来做。如果研究者直接把探索性因子分析的结果放到统一数据的验证性因子分析中,研究者就仅仅是拟合数据,而不是检验理论结构。如果样本容量足够大的话,可以将数据样本随机分成两半,合理的做法就是先用一半数据做探索性因子分析,然后把分析取得的因子用在剩下的一半数据中做验证性因子分析。
今天我们主要来详细讲解一下验证性因子分析
1 背景
下表是理科班的 100 名同学的语文、数学、英语、物理、生物、化学成绩。研究者想要验证他们的语文、英语成绩是否可以反映理科班的文科成绩水平;他们的数学、物理、生物、化学成绩是否可以反映理科班的理科成绩水平。
2 分析步骤
2.1 模型构建
首先对样本进行频数统计,验证性因子分析要求总样本数据(行数)最少是全部题目(列数)的5倍以上,最好10倍以上,且一般情况下至少需要200个样本;
2.2 删除不合理测量项
通过因子载荷系数对因子内测量变量进行筛选,一般来说,测量变量通过显著性检验( < 0.05或0.01),并且标准化载荷系数值大于0.7,可表明测量变量符合因子要求,条件差距太大可以考虑删除变量;
2.3 模型评价
根据平均公因子方差抽取量(AVE)与组合信度(CR)结果可以分析因子内的测量指标的提取度,一般来说AVE要求高于0.5,且越接近1代表测量指标提取程度越高,CR要求高于0.7
2.4 分析总结
3 软件实现
3.1 案例操作
3.2 结果解释
3.21 因子基本汇总表
样本数据集共有因子数量 2 个,变量数 6 个,样本数量200个,满足验证性因子分析基本数据要求。
3.22 因子载荷系数表
●测量变量通过显著性检验(p < 0.05),且标准化载荷系数值大于0.6,可表明测量变量符合因子要求,条件差距太大可以考虑删除变量
理科(因子 1)的测量项(物理、化学、生物)水平上呈现显著性(p<0.05),拒绝原假设,同时其标准载荷系数均大于 0.6,可以认为其有足够的方差解释率表现各变量能在同一因子上展现。
文科(因子 2)的测量项(英语)水平上呈现显著性,拒绝原假设,同时其标准载荷系数均大于 0.6,可以认为其有足够的方差解释率表现各变量能在同一因子上展现。
3.23 模型评价
●一般来说AVE高于0.5或CR高于0.7表明聚合效度较高,只需要看其中一个即可
基于理科,平均方差抽取量(AVE)的值为 0.792,大于 0.5,组合信度 CR 值为 0.936,大于 0.7,说明因子内的测量指标提取度优秀。
基于文科,平均方差抽取量(AVE)的值为 0.916,大于 0.5,组合信度 CR 值为 0.956,大于 0.7,说明因子内的测量指标提取度优秀。
删除评价3.24 Pearson 相关与 AVE 平方根值
●上表是根据因子之间的均值做相关性检验,用于研究因子的区分效度是否表现较优秀,斜对角线是平均方差抽取量的平方根,用于表明因子内部的相关性强度。如果因子的平均方差抽取量(AVE)的平方根大于其他因子的Pearson相关系数值,则说明其具有较为优秀的区分效度。
理科的平均方差抽取量(0.89)和文科的平均方差抽取量(0.957)都大于因子 1 和因子 2 的 Pearson 相关系数值(即 0.378),则说明具有较为优秀的区分效度。
3.25 模型拟合指标
上表展示了模型的拟合指标,可以适当选择一些指标进行评价,若所有指标均不满足,可以考虑根据 2,3 对因子的测量指标进行删除或者重构。
表中 GFI、CFI、NFI 是满足的 ,可以认为模型较合适。
3.26 因子协方差表
上表展示了因子协方差分析的结果,其作用时用来验证因子的区分程度;两两之间的标准系数值,一般情况下越接近1,说明因子之间具有较强的关联性。
协方差分析的结果显示: 理科 与文科的标准估计系数为 0.406,呈现中等的关联性。
4 总结
验证性因子分析研究重点关注于结构效度,它是指问卷所能衡量到理论上的概念或特质的程度, 即问卷所要测量的概念能显示出科学意义并符合理论设想,是通过与理论假设比较来检
验,分为聚合效度和区分效度。 聚合效度是同属一个因子的测度项之间具有高度的相关性。 区分效度代表不同因子对应的测度项之间的相关系数大小 。
发布评论