简介
临床医生或者研究人员往往在分类资料分析时统计具有某种属性的个体数,调查或科研中清点分类变量资料所得到的数据称之为绝对数。绝对数可以反映研究事物或现象的基本信息,但是不便于相互比较和寻找事物间的内在联系,因此,常常使用相对数(relative number)如率,构成比,相对比等来描述和比较这类资料。 分类变量分为无序分类和有序分类,无序分类包括二项分类和多项分类,如计数资料;有序分类指变量之间有程度的差别,且排列有序,如等级资料。根据不同的资料类型,选用不用的统计分析方法,如Pearson卡方检验,Wilcoxon秩和检验以及Fisher’s 确切概率法检验等。
统计分析方法选择
单样本资料与总体比
1、二分类资料:1) 小样本时:用二项分布进行确切概率法检验。2) 大样本时:用U检验。
2.多分类资料:用Pearson卡方检验。
四格表资料
1. n>40并且所以理论数大于5,则用Pearson 卡方。
2. n>40并且所以理论数大于1并且至少存在一个理论数<5,则用校正卡方或用Fisher’s 确切概率法检验。
3. n<< span="">40或存在理论数<1,则用Fisher’s 检验。
2×C表资料的统计分析
1.列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则行评分的CMH c2或成组的Wilcoxon秩和检验。
2.列变量为效应指标并且为二分类,列变量为有序多分类变量,则用趋势卡方检验。
3.行变量和列变量均为无序分类变量: 1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson 卡方。2)n<40或理论数小于5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验。
R×C表资料的统计分析
1. 列变量为效应指标,并且为有序多分类变量,行变量为分组变量,则CMH 卡方或Kruskal Wallis的秩和检验。
2. 列变量为效应指标,并且为无序多分类变量,行变量为有序多分类变量,作none zero correlation analysis的CMH 卡方。
3. 列变量和行变量均为有序多分类变量,可以作Spearman相关分析。
4. 列变量和行变量均为无序多分类变量:1)n>40并且理论数小于5的格子数<行列表中格子总数的25%,则用Pearson卡方。 2)n<40或理论数小于< span="">5的格子数>行列表中格子总数的25%,则用Fisher’s 确切概率法检验。
应用举例-Pearson’s Chi-squared test results
参考文献:
Joana C, et al. CYR61andTAZUpregulation and Focal Epithelial to Mesenchymal Transition May Be Early Predictors of Barrett’s Esophagus Malignant Progression[J]. PLoS One.; 11(9): e0161967.
如果觉得《生物医学数据统计分析-分类资料统计分析》对你有帮助,请点赞、收藏,并留下你的观点哦!