相关系数r 的两个公式 线性回归r的两个公式


理解与运用回归分析

回归分析主要是探讨一个或多个自变量X对一个因变量Y(均为定量数据)的影响关系。这种关系的研究有助于我们理解变量间的内在联系及影响程度。

当只有一个自变量时,我们称之为一元线性回归;而当有两个或更多自变量时,则称为多元线性回归。例如,研究吸烟、喝酒、久坐这些行为对高血压患病风险的影响,就是一个多元线性回归的实例。

在SPSSAU的软件界面中,我们可以通过其“通用方法”里的“线性回归”功能来进行操作。回归分析主要用来研究X(可以是定量或定类数据)对Y的影响关系,以及这种关系的方向和程度。

分析步骤详解

第一步,首先需分析模型的拟合情况。这包括查看R方值以及VIF值。VIF值能够帮助我们判断是否存在共线性问题,而共线性问题则可以通过岭回归或逐步回归等方法进行解决。

第二步,书写模型公式(这一步是可选的)。

第三步,分析X的显著性。如果呈现出的p值小于0.05或0.01,那么就说明X对Y有显著的影响关系。接着,我们需要具体分析这种影响关系的方向。

第四步,结合回归系数B值,对比分析X对Y的影响程度。这一步也是可选的。

第五步,对分析进行总结。

在进行回归分析之前,我们可以使用箱盒图来查看是否有异常数据,或者使用散点图来直观地展示X和Y之间的关联关系。而在分析之后,我们可以使用正态图来观察和展示保存的残差值正态况,或者使用散点图来观察和展示回归模型是否存在异方差现象(残差与X间的散点完全无关则无异方差)。

具体指标解读

1. t值:它是回归系数与回归系数的标准误之比。

2. VIF(方差膨胀因子):其值介于1~之间,值越大表示自变量之间共线性的可能性越大。

3. R2:它是判断线性回归直线拟合优度的重要指标,表示因变量的变异中有多少百分比是由自变量引起的。

4. 调整R2:当自变量增多时,它与R2的差值可能会增大。

5. F值:它是回归均方与残差均方之比,用于评估模型的整体显著性。

对于模型的其他方面如ANOVA表格中的F检验、回归系数的解读、以及对于数据预处理如对数转换以解决单位问题等也都进行了详细解释。并且还提供了一些实际操作中可能遇到的问题及解答,如当问卷设计导致Y缺失时的处理方法、对比自变量影响大小的标准、是否需要先做相关分析等。