糖尿病康复,内容丰富有趣,生活中的好帮手!
糖尿病康复 > logistic回归分析优点_二元Logistic回归

logistic回归分析优点_二元Logistic回归

时间:2021-11-27 23:51:52

相关推荐

logistic回归分析优点_二元Logistic回归

点击上方蓝字关注我们

在社会科学的研究中,经常会遇到二元变量的情况,例如死亡或未死亡、购买或未购买等,对于二元变量,无法直接采用一般的多元线性模型无法进行回归分析,因为残差不满足正态性、无偏性、共方差性等假设,同时解释变量的取值范围不再是-∞~+∞。如果希望根据一系列预测变量的值来预测某种特征或结果是否存在,且因变量为二元变量,通常采用二元Logistic回归。

1二元逻辑回归分析的原理与线性回归模型一样,二元逻辑回归模型也需要对模型进行检验和评价,同样分为对回归方程整体的显著性检验、回归系数的显著性检验和模型拟合优度评价。1.回归方程整体显著性检验与一般的线性模型一样,二元逻辑回归方程的显著性检验用于检验In与所有变量之间的线性关系是否显著,检验的原假设是各回归系数同时为零,备选假设为各回归系数不同时为零。常用的检验方法有对数似然比检验和Hosmer-Lemeshow检验。2.回归系数的显著性检验与一般线性回归模型一样,还需要对每个回归系数的显著性进行检验。但是,在二元逻辑回归模型中,回归系数显著性检验不是通过T检验,而是构造Wald统计量来进行,Wald 统计量和似然统计量都是极大似然估计方法中常用的检验统计量。3.模型拟合优度评价二元逻辑回归模型拟合优度评价的常用统计量包括Cox-Snell R方统计量和NagelkerkeR方统计量。2二元Logistic回归的SPSS实现“data 09.sav”数据文件是一些肿瘤患者的基本资料。现要求利用通过年龄、肿瘤大小和扩散等级来拟合癌变部位的淋巴结是否含有癌细胞的二元Logistic回归方程。1.打开 “data 09.sav” 数据文件,选择“分析”—“回归”—“二元Logistic”,弹出如下图所示“Logistic回归”对话框,在左侧的变量列表中选中“癌变部位的淋巴结是否含有癌细胞”,将其选入“因变量列表”,将“年龄”、“肿瘤大小(厘米)”、“扩散等级”变量选入右边的“协变量列表”,“方法”选择系统默认的“输入”。2.单击【分类】按钮,弹出如下图所示的“Logistic回归:定义分类变量”对话框,将“扩散等级”变量选入分类协变量列表,对比方法选择系统默认的指示灯。单击【继续】按钮返回主对话框。3.单击“保存”按钮,弹出如下图所示的“Logistic回归:保存”按钮。在“预测值”栏中勾选“概率”和“组成员”复选框,在“影响”栏中勾选“杠杆值”复选框,在“残差”栏中勾选“标准化”复选框,并勾选“包含协方差矩阵”复选框。单击【继续】按钮返回主对话框。4.单击【选项】按钮,弹出如下图所示的“Logistic回归:选项”对话框。在“统计和图”栏中勾选“分类图”、“Hosmer-Lemeshow拟合度”、“exp(B)的CI”,其他为系统默认。单击【继续】按钮返回主对话框。

5.完成所有设置后,单击【确定】按钮执行命令。3二元Logistic回归的结果分析1.从表1中可以看出参与分析的个案为978,无缺失值。2.表2为因变量变量的编码。表3为自变量中的分类变量根据指示变量编码方案所生成的新变量。新变量的变量名称为扩散等级(1)何扩散等级(2)。3.表4是拟合开始前模型外变量的卡方检验,所有变量的显著性均小于0.05,整体的显著性也小于0.05,整体的显著性也小于0.05,所以,所有变量进入模型都是有意义的。4.表5是3种常用的卡方统计量,因拟合方法选择的是输入,所以一步就完成了模型的拟合,所以,步长、块和模型的卡方值都相同,显著性小于0.05,说明解释变量的全体与Logit P之间的线性关系显著,采用此模型是合理的。5.表6是模型拟合优度统计量,表中的-2对数似然值为838.913,值较大,说明模型拟合效果不是很好,Cox&snell R平方和Nagelkerke R 平方值分别为0.087和0.142,值较小,说明模型方程能解释的回归变异很小,模型拟合不理想。6.表7给出了Hosmer和Lemeshow检验的统计量,显著性小于0.05,所以拒绝零假设,表示方程拟合效果不理想。7.表8是Hosmer和Lemeshow检验的列联表,根据预测概率,将数据分为10组,第2行和第3行是“癌变部位的淋巴结是否含有癌细胞=无”的观测值和期望值,第4行和第5行是“癌变部位的淋巴结是否含有癌细胞=有”的观测值和期望值,可见各行的观测值和期望值存在一定的差异,说明模型拟合效果不理想。8.表9是观测值和预测值的分类表,从表中可以看出798名癌变部位的淋巴结没有癌细胞的患者被准确预测,正确率只有97.9.0%,但是只有16名癌变部位的淋巴结含有癌变细胞的患者被准确预测,正确率只有9.0%,总的正确率为81.7%,说明预测效果不理想。9.表10给出了各变量的系数(B),可以写出方程:Z=1.116*肿瘤大小(厘米)+2.953*肿瘤扩散等级(1)+2.026*肿瘤扩散等级(2)-5.714得出估计淋巴结中是否含有癌细胞的概率为:

后台回复【二元Logistic回归】获取案例中的数据。

参考资料:

李昕,张明明.SPSS 22.0统计分析[M].北京:电子工业出版社,.

图文:郭鑫排版:郭鑫

如果觉得《logistic回归分析优点_二元Logistic回归》对你有帮助,请点赞、收藏,并留下你的观点哦!

本内容不代表本网观点和政治立场,如有侵犯你的权益请联系我们处理。
网友评论
网友评论仅供其表达个人看法,并不表明网站立场。