2022-05-07 4293

还在用AMOS做结构方程模型(SEM)?

作者:SPSSPRO

写在前面:

 

 

提到分析两个变量间是否存在关联时,首先想到的是相关性分析,但是相关性只能表明两个变量存在相互关系,但无法得出哪个变量是因?哪个变量是果?况且,相关性分析只是两个变量数量上的相互关系,而在实际情况中,有些变量可能不是直接与其它变量发生相互作用,而是通过第三个变量间接的与靶标变量关联。

 

 

这个时候就可以考虑用到结构方程模型(SEM),将两个或多个结构模型联合起来,以实现对多元关系进行建模的统计框架,可以解决相关性分析中无法得到的因果关系以及区别直接和间接作用。

 

 

1 概述

 

 

1.1 概念

 

 

SEM 结构方程模型是一种基于因子分析、线性回归方法、用于分析错综复杂变量之间路径关系的一种模型。与线性回归不一样的是,SEM 是以量表为单位的,也就是将量表通过因子分析降维成 1 个主成分(多个变量转化为一个变量),再进行路径分析。

 

 

SEM是因子分析和路径分析的结合,它的初衷是针对潜变量之间关系进行建模。当我们面对一个难以描述概念时,就需要找到符合该概念下的指标。比如健康这个概念,我们很难描述,就会用心率、血压、体温等等指标来反映这个概念。当我们有了一定的研究后,从理论上已经分析出了多个难以描述的指标之间的关系,就需要用到结构方程模型

 

 

1.2 分析思路

 

 

模型构建→探索性因子分析/验证性因子分析→设置模型→评估模型→模型调整

 

 

1.21 模型构建

研究者根据专业知识,通过推论何假设形成一个关于变量之间相互关系(常常是因果关系)的模型,这个模型也可以用路径表明制定变量之间的因果关系。

 

 

1.22 探索性因子分析/验证性因子分析

建前需要保障好测量关系的质量,建议结构方程模型 SEM 分析之前先进行探索性因子分析和验证性因子分析,确保测量显变量与潜变量关系良好后再进行 SEM 分析

 

 

1.23 设置模型

在确认好测量关系的高质量之后,接着正式进行结构方程模型构建

 

 

1.24 评估模型

评价模型样本数据拟合程度,否具有统计学意义,并且是否能够很好的与专业知识相吻合。

 

 

1.25 模型调整

当尝试模型出现不能拟合观察数据的情况时,就需要将模型进行修正

 

 

2 案例讲解

 

 

2.1 案例介绍

 

 

研究“幸福感”的影响因素,有四个因子可能对幸福感有影响,他们分别是:经济水平、受教育程度、情感支持。与路径分析的案例不同,在这四个因子上,进行了进一步的细分。

 

 

每个因子由多个变量组成,其中经济水平包括(衣、食、住、行)、情感支持包括(父母关心、同学相处、老师指导)、受教育程度包括(学校资源、补课程度)、幸福度包括(满足感、开心感)。

 

 

 

 

3 案例操作

 

 

3.1 模型构建

 

 

本例中,我们想要使用结构方程模型,构建幸福度模型。也就是研究经济水平和教育水平对情感支持水平的影响关系,以及情感支持水平对幸福度的影响关系。

 

 

3.2 探索性因子分析/验证性因子分析

 

 

 

 

3.3 设置模型

 

 

在确认好测量关系的高质量之后,接着正式进行结构方程模型构建。

 

 

 

 

3.4 评估模型

 

 

3.41 模型路径图

 

 

 

 

根据结构模型的带权路径图,分析因子路径影响关系情况,可以从全局了解各因子节点的路径构成与关系。

 

 

3.42 因子载荷系数表

 

 

 

 

通过因子载荷系数对因子内量变量进行筛选,一般来说,测量变量通过显著性检验( <0.05),并且标准化载荷系数值大于0.6(严格为0.6,SPSSPRO默认阈值为0.4),可表明测量变量符合因子降维的要求,如果条件差距太大可以考虑删除变量(变量设置不合理)。

 

 

可以看到,基于四个因子,水平上均呈现显著性,则拒绝原假设,同时其标准载荷系数均大于0.4,可以认为其有足够的方差解释率表现各变量能在同一因子上展现。

 

 

3.43 模型回归系数表

 

 

 

 

上表展示了路径节点的回归系数,可以理解为一个最小二乘法一元线性回归,通常只需要观察p值与标准化路径系数,确定该路径(X—>Y)是否存在直接的线性影响。

 

 

三种配对项水平上均呈现显著性,则拒绝原假设,因此此路径有效。

 

 

3.44 模拟拟合指标

 

 

 

 

指标解释:

 


● 卡方和自由 df 度主要用于比较多个模型,卡方值越小越好,自由度反映了模型的复杂程度,模型越简单,自由度越多,反之,模型越复杂,自由度越少。 
● GFI(拟合优度指数):主要是运用判定系数和回归标准差,检验模型对样本观测值的拟合程度。其值在 0-1 之间,愈接近 0 表示拟合愈差。CFI≥0.9,认为模型拟合较好。
● RMSEA(近似误差均方根):一般情况下,RMSEA 在 0.08 以下(越小越好)。
● RMR(均方根残差):该指标通过测量预测相关和实际观察相关的平均残差,衡量模型的拟合程度。如果 RMR < 0.1,则认为模型拟合较好。
● CFI(比较拟合指数):该指数在对假设模型和独立模型比较时,其值在 0-1 之间,越接近 0 表示拟合越差,越接近 1 表示拟合越好。一般情况,CFI≥0.9,认为模型拟合较好。
● NNFI(非规范拟合系数)和 CFI(比较拟合指数) :其值越大越好,所拟合的模型表现较好。

 

 

由上表可知,大部分指标都满足要求,说明拟合的模型表现较好。

 

 

3.45 路径节点协方差关系表

 

 

 

 

协方差表格分析了模型中没有入度的节点(即没有箭头指向它的节点),用于分析路径节点之间的关联性。 

 

 

由上表可知, 经济水平与情感支持水平的协方差关系呈现显著性,标准化系数为 0.504,有中等的关联性,建议加入路径关系进行分析。

 

 

3.5 模型调整

 

 

根据上述的分析结果,我们可以考虑增加经济水平到情感支持水平的路径后,再做一次结构方程模型。

 

 

4 总结

 

 

结构方程模型 SEM 构建前需要保障好测量关系的质量,建议结构方程模型 SEM 分析之前先进行探索性因子分析和验证性因子分析,确保测量显变量与潜变量关系良好后再进行 SEM 分析。

 

 

结构方程的路径关系可以用来反驳一个表明变量之间存在因果关系的模型;但是,它不能用来证明变量之间存在因果关系。

 

 

相比起路径分析,SEM多了一个因子测量模型,用于将多个变量转换为一个因子(变量),该步骤用于探究因子的变量构成是否在同一个主成分上。当我们想对难以描述的概念建立路径时,比如想要建立”生活习惯->健康“这个路径,其中两个概念都很难描述,我们可以用饮食均衡、坚持运动等等指标来反映生活习惯,用心率、血压、体温等等指标来反映这个概念。