许栩原创专栏《从入门到高手:线性回归分析详解》第8章,显着性验证,总体验证的F检验与个体验证的t检验。
上一章,我讲述了回归方程的精度,在回归分析中,我们求出回归方程后,除了确认回归方程的精度外,我们要需要对回归方程进行显着性验证,以确认回归方程的有效性。
本章,我同样分如下三个小节对显着性验证进行讲解,欢迎阅读与探讨。我的《线性回归分析》专栏总目录见下图。
1、什么是显着性验证?
2、回归方程的总体显着性验证(F检验)。
3、回归系数的个体显着性验证(t检验)。
一、什么是显着性验证?
如果回归模型用于需求预测是有效的(显着的),那么,回归模型不仅仅是对我们建模时所用到的数据有效,对其他数据也应该用样有效。证明回归模型对其他数据同样有效的过程,就是显着性验证(significance testing),也称有效性验证。如果验证的结果反馈对其他数据无效,那么,代表我们的回归模型(回归方程)出现了问题,我们需要调整自变量或重新建模。
以上是我给显着性验证的一个粗暴定义。
显着性验证的定义其实非常复杂,也有些难懂(比如下面引用的百科定义)。在本专栏的两点说明中,有一点我提到“尽可能减少原理性讲述”,本着这个思路,我给出了如上的简化定义。因为,我们不是研究回归分析这个学科或学术,我们只是将回归分析应用于需求预测。所以,对于应用回归分析的我们来说,懂得这个粗暴定义应该足够了。
【显着性验证百科定义】显着性验证,是事先对总体(随机变量)的参数或总体分布形式做出一个假设,然后利用样本信息来判断这个假设是否合理,即判断总体的真实情况与原假设是否有显着性差异。
显着性验证的方法一般有两种,一是测算回归方程总体显着性的F检验,二是测算变量解释系数(即回归系数)个体显着性的t检验。
进行F检验或t检验,都需要知道一个概念,显着性水平。什么是显着性水平呢?显着性水平是估计总体参数落在某一区间内,可能犯错误的概率,用α表示。
有点绕吧,我将其翻译成简单点的:显着性水平就是对这个模型运行结果没有把握的程度,与之相对应的是置信度。比如说,用回归分析对火锅店的业绩进行预测,对预测结果,有80%的把度,这80%就是置信度,20%(1-80%)则是显着性水平。(置信度与置信区间我将在下一章详细讲述。)
接下来我分别介绍F检验和t检验这两种显着性验证方法。
二、回归方程的总体显着性验证(F检验)。
如本专栏说明所说,“尽可能减少原理性讲述”,F检验和t检验,我都不进行原理性讲解,只介绍计算方法和判定标准。
F检验测算的是回归方程的总体显着性,我们以Excel的数据分析工具进行F检验。(原始数据仍使用本专栏模拟的“回归火锅店”的数据。)
我们看上图。上图是以5%的显着性水平(置信度95%),用Excel的数据分析工具中的回归分析计算的结果。结果显示,F统计值为15.19。
那么,F统计值为15.19,这个15.19,是高还是低呢?在回归方程的总体显着性验证中怎么评估呢?这就需要根据F检验的评价标准而定。
F检验的评价标准及怎么去评价,
如果觉得《线性回归分析8:显著性验证 总体验证的F检验与个体验证的t检验》对你有帮助,请点赞、收藏,并留下你的观点哦!