基础研究常用统计方法
数据收集好之后,如何判断这些数据是否有差异呢?如何判断这些差异是偶然误差还是本质差异呢?有些图片数据可以一眼分辨出差别,判定有或无(好和坏)。但是大多数数据都需要进一步进行统计学分析来判断是否有差异。基础研究和临床研究对统计分析要求有所不同。统计分析在基础研究中大多是在研究结束之后才开始的,而对于临床研究,统计分析贯穿于临床研究的整个过程中,从研究设计伊始的样本量计算,到研究实施中对研究方案的调整,到最后的数据分析,发挥关键性作用。本节仍然分为基础研究和临床研究两部分来介绍数据统计分析。
一、基础研究常用统计方法
基础研究需要设计空白组、阴性对照组、不同的处理组,有时候还会设计阳性对照组,所以需要分析的是两组之间或是多组之间的结果是否有统计学差异。基础研究的结果在展示时一般会采用定量的数据,即使是一些图片结果如Western blot一般也会转换成定量数据分析。所以,基础研究的统计分析多是两组之间或是多组之间的定量数据比较。基础研究一般需要重复,其数据大多是正态分布,用均值±标准差(Standard deviation,SD)(或标准误,St
andard error of mean,SEM)展示。
1.两组之间的比较
两组之间的数据比较一般用t检验,只有满足如下三点的数据才能使用t检验:(1)数据是独立连续性数据;(2)数据正态分布;如果数据不符合正态分布,有时候可以进行适当的数据转换(小技巧3.3);(3)两组间方差齐性。如果不满足这三点,则需要使用非参数检验(Nonparametric test)。等级资料使用Wilcoxon秩和(Wilcoxon rank sum)检验,二分类资料使用卡方检验(c2-test,or chi-square test),或费舍尔精确检验(Fisher’s exact test)。(实例3.3)
小技巧3.3 数据转换
有很多临床数据如红细胞、白细胞、病毒滴度等都是偏态分布,但是可以通过适当的方式转换成正态分布,最常用的数据转换方式是对数转换。
实例3.3
研究者利用小鼠肝纤维化模型研究某一中草药单体A是否具有抗纤维化活性。假设分为溶剂组和药物组处理肝癌裸鼠模型,通过检测小鼠血液ALT、AST水平、肝脏病理等级、是否死亡等观察药物处理是否具有抗纤维化作用。ALT和AST是连续数据变量,一般来说呈正态分布。如果方差齐性,则两组之间ALT和AST的比较用t检验分析;如果不是方差齐性或是非正态分布,则用Wilcoxon秩和检验。肝脏病理等级非连续性数据变量,两组之间的比较只能用Wilcoxon秩和检验。是否死亡是一个二分类变量,两组之间的比较只能用卡方检验,如果每组动物死亡或存活数少于1或者总动物数少于40只,则用费舍尔精确检验。
2.多组之间的比较
多组之间的比较和两组之间的比较有点类似,首选是方差分析(Analysis of variance, ANOVA),它的使用条件和t检验一样有三点:(1)数据是独立连续性数据;(2)数据正态分布;(3)多组间方差齐性。只有三点都满足的数据才能使用方差分析,方差分析的结果只是说明多组中至少有一组有差异,但是具体是哪一组或是哪几组之间有差异还需要进一步进行两两比较,即验后多重比较(Post hoc tests或Post hoc 分析)。两两比较有多种方法,常用的如最小显著差异法(Fisher’s Least Signicant Dierence,LSD)、Bonfe
rroni校正法(Bonferroni correction)、Student-Newman-Keuls (SNK)法、Duncan法和真实显著差异法(Tukey Honestly Significant difference,HSD),其严谨度各不相同,因此适用情况略有差别,大家可以根据需要和目的选择性使用(参考凌莉主编的《生物统计学基础》)。
如果数据不满足方差分析条件,就使用非参数检验。等级资料使用Kruskal-Wallis H检验,两两比较使用校正显著性(P值)值后的Kruskal-Wallis检验。多分类资料使用卡方检验。(实例3.4)
实例3.4
研究者利用小鼠肝纤维化模型研究某一中草药单体A是否具有抗纤维化活性。假设分为溶剂对照组和不同浓度药物组(1,2,3)处理肝癌裸鼠模型,通过检测小鼠血液ALT、AST水平、肝脏病理等级、是否死亡等观察药物处理是否具有抗纤维化作用。ALT和AST是连续数据变量,一般来说呈正态分布,如果方差齐性,则4组之间ALT和AST的比较用方差分析,如果方差分析表明各组数据之间有差异,究竟是哪两组之间有差异就要进行Post hoc分析,确定溶剂对照组和不同浓度药物组是否分别有差异以及不同浓度药物组之间是否有差
研究方法有哪些异。如果不同浓度药物组均与对照组有差异且不同浓度药物组之间均有差异,ALT和AST水平和浓度有一定的相关性,我们一般说药物的抗纤维化活性是剂量依赖性的。如果所有数据不是方差齐性或是非正态分布,则用Kruskal-Wallis秩和检验。肝脏病理等级非连续性数据变量,多组之间的比较只能用Kruskal-Wallis秩和检验。是否死亡是一个二分类变量,多组之间的比较只能用卡方检验,如果每组动物死亡或存活数少于1或者总动物数少于40只,则用费舍尔精确检验。