第九章临床科研中常见偏倚及其控制方法
第一节  真实性偏倚与机遇的概念
真实性  指一项观察或研究所推论观点的正确性及可靠程度,即所得结果反映研究对象的真实情况
临床医学研究的目的是从样本人,通过观察或研究,努力取得研究变量同结果变量间的真实联系,并将此真实联系推广到样本人及其所属目标人(或参照人)范围内流行病学上将能正确反映样本人及目标人真实状况的研究结果的外延性称作内部真实性,若将该项研究成果推广到目标人以外的其他人仍然得到同样的结果,表明该项研究成果不但具有内部真实性,而且同时具有外部真实性一项没有内部真实的研究结果,不可能具有外部真实性,但有内部真实性的研究成果,不一定具有外部真实性
样本偏倚是临床科研中特别值得注意的问题,许多临床研究是在三级医院中进行的,而三级医院是重病集中的场所,容易将疾病描绘得严重一些,在三级医院中所获得的研究结论有时并不适用于一般人例如急性心肌梗死病死率,三级医院的资料常低于一般社会人,原因是心肌梗死戒烟方法
死亡的病人50%是发生在未送医院之前样本偏倚与后面要讲的选择性偏倚不同,样本偏倚仅涉及将医院里的研究结论推广到体时产生,而不涉及内部真实性,而选择性偏倚涉及内部真实性,因此,临床工作者必须注意树立体观点(见图9-1)
        病人总体                                              内部真实性
      (包括其他设施中的病人)
                                抽样
                                                            选择偏倚
                   
                            ?
                                                            测量偏倚
                                                                      混杂偏倚
                                  ??
        外部真实性
                                                              机遇
  (    外推至样本所属总体或其他地区的人)
                                                                      研究所得结论
 
                  图9-1内部真实性与外部真实性
偏倚  指研究所得资料的推论偏离真值。或者说,自样本人所得变量与结果变量的联系,不能反映目标人的暴露变量与结果变量的真实联系。在临床科研中,偏倚是在研究对象各组间某变量有否差异的过程中产生的一种系统误差例如,甲组的疗效优于乙组;急性心肌梗死范围大的患者其预后比梗死范围小的患者要差;CT诊断脑瘤的符合率比放射性核素扫描为高等。临床研究中所获得之各组变量间的差异,有时并非代表真实情况,这种现象就是偏倚(对真实情况的偏离)。必须指出,与基础科学研究相比较,临床科研特别容易产生偏倚,因为临床科研的对象是人,不可能象动物那样做到组间基本情况均相等,而且病人还有心理变化,拒绝试验或中途退出试验等影响科研结果正确性的情况。因此,偏倚在临床科研中是普遍存在的,要做到完全没有偏倚似乎是不可能的,但研究者的责任是尽量减少各种偏倚的产生,应当在设计阶段和科研实施阶段设法控制它,防止其形成。有些偏倚一旦形成,就需要在资料分析阶段用统计学方法加以处理并进行纠正。但有些偏倚在资料分
析阶段已无法纠正,因此,偏倚的识别和防止方法应当成为临床科研工作者必须掌握的知识与技能。
三、机遇  是一种随机误差,是指各测量结果之间由于受机遇的影响所发生变异的大小。机遇是任何观察所固有的,无一定定性,对其只能设法缩小,不能避免。
            动脉内插管测知                  通用血压计测知的
            的舒张压真值                    舒张压读数
                       
观                      ●●
察                     ●●●●
例                 ●●●●●●●●●●●●
数                     ●●●●
                       ●●
                                          随机误差
    系统误差(偏倚)
 
                      舒张压测得值(mmHg)
              图9-2  系统误差(偏倚)与随机误差(机遇所致)的关系
            (动脉内插管测得的血压真值与一般通用血压计测量的血压值的比较)
机遇对临床研究结果的影响,主要表现在假阳性和假阴性错误上。例如,评价甲乙两种疗法,假定研究时消除了所有的偏倚,又假定两种疗法事实上疗效相同。如果是来自少数病例的抽样研究,或许会发现甲疗法显著优于乙疗法,这就是由于机遇的影响而发生了假阳性错误;另一种情况是假定两种疗法事实上一种比另一种好,但在涉及少数病例的抽样研究中,由于机遇的影响,或许两者的疗效看来十分接近而做出假阴性的错误判断。
为排除机遇在临床科研中的干扰,研究者应当设法估计机遇所致假阳性与假阴性错误的概率。假阳性错误在统计学上又称为一类错误,其概率用α表示,假阳性错误在于当某疗法并不优于另一疗法时,却下结论认为该疗法优于另一疗法。假阴性错误又称二类错误,其概率用β表示。是指当两疗法事实上有差异,但下结论时却变为两者无差异。
用假设检验法,先假定研究中的某疗法同对照疗法疗效一样(无效假设),但研究结果显示该疗法比对照疗法更加优越。现用假设检验法设问:如果说研究中的疗法不比对照组效果好,那么由机会(或偶然性),碰巧取得目前所得到的优异结果的概率(α)有多大?若该概率较大(>0.05),则可以认为:即使该疗法疗效同对照组相似,但由于机遇也很可能出现研究中的优异结果,因此,无效假设被接受,即结论是该疗法不比对照疗法优越。相反,
α<0.05是时,说明单由机遇、碰巧所致的概率特别小,按统计学一般公认的标准几乎不可能以生,因此,在研究中所出现的这种结果,只能是该疗法本身的优越性所致,不能用机遇来解释。结论是该疗法优于对照疗法。这意味着错误的概率或犯假阳性错误的概率<0.05,是很小的了。因此,通过假设检验,对由机遇造成的假阳性错误的概率做了估计,弄清了机遇干扰的程度,从而保证了结论的确定性。
第二类错误,即假阴性错误,其概率用β表示。当一项研究中的两种相比较的疗法确有差异,但因该项研究只是一个小样本(往往是这种原因!),机遇会有较大的可能性使结果呈现出两疗法疗效相似,于是得出结论是两疗法无差异,此即假阴性错误。这种情况提示,研究设计应尽量收集足够大的样本,减少机遇导致假阴性错误的概率,提高识别阳性结果的能力,统计检验即是检验单纯由机遇引致第二类错误的可能性大小,从而使得下结论时为掌握好分寸而有所依据,而不致失之偏颇。
另外一种估计机遇在临床研究中作用大小的方法是直接估计,即可能包含真实值的范围,用可信区间表示。一般用95%或99%可信区间。95%可信区间的意思是:如果从一研究样本测量某疗法的疗效,获得一个自样本测得的效应值,比如p±1.96sp(其中p是效应值,即某疗法的
疗效,sp为率的标准误的估计值),说明总体的真实效应值有95%的机会在p±1.96sp的范围内,这就直接显示机遇所致的该真实值的变异大小;变动范围越狭,真实值越稳定、确实。如果两种疗法各自的95%可信区间不相交,可以认为二者疗效差异显著。可信区间的另一重要优点是它给出了具体值,使研究者依此从临床意义的角度评价该项统计学差异的统计学意义是否也具有临床意义。
第二节  临床科研中常见的偏倚
一、偏倚的方向性
偏倚作为一种系统误差,它在偏向正方向时,可使原来的真值被夸大,或偏向负方向,而使真值被缩小,因而其有方向性。
二、偏倚的种类
偏倚可以发生在临床研究的各个阶段。从总体上可分为三大类:第一类为选择性偏倚,主要发生在研究的设计阶段;第二类为测量偏倚,又称之为信息偏倚,主要发生在观察、研究、测量等实施阶段;第三类为测量偏倚,在设计阶段若不注意随机化原则,不注意两个比较组
除欲比较的因素外都应力求均衡的原则,在资料分析阶段又未设法发现或纠正,即可发生。
(一)选择性偏倚
指由于选择研究对象的方法存在问题,使被选中的对象和没被选中的对象的特征之间存在差异,从而导致研究结果偏离真实情况。此种偏倚各类流行病学研究均可以发生,尤其在现况研究、病例对照研究和临床试验中常见,主要发生在研究设计阶段,亦可发生于资料收集过程中的失访或无应答等场合。
1.选择性偏倚的常见种类:
1.1入院率偏倚  又称伯克森氏(Berkson s偏倚)。指利用医院就诊或住院病人作为研究对象时,由于入院率(就诊机会)不同而导致的偏差。利用医院资料进行研究最易发生此种偏倚。
表9-1表示呼吸道疾病与骨及运动器官疾病的关系,左侧四格表取样于一般人,右侧四格表取样于曾住院6个月以上者;表9-2表示过敏及代谢性疾病与疲乏的关系,左侧四格表取样于一般人,右侧四格表取样于曾住院6个月以上者。两表左侧部分表明,其OR值分别为1.06和1.89。但对人中曾住院6个月以上者单独分析(表9-1及9-2的右侧部分)则发现OR值
分别为4.06和0.37。亦即,前者的OR值虚假地升高了(从1.06到4.06),而后者的OR值却虚假地降低了(从1.89到0.37)。究其原因是表9-1右侧四格表中的a格,即因骨及运动器官疾病曾住院6个月以上者,患呼吸道疾病的比例高(5/33=0.15),而一般人中患呼吸道疾病的比例较低(17/201=0.08),于是选择骨及运动器官疾病曾住院者为研究对象时就高估了OR值;反之,有过敏及代谢性伴疲乏的病人入院机会较少,故表9-2中右侧四格表中的a格过敏及代谢性疾病的比例较低(1/28=0.04),而一般人中有过敏及代谢性疾病的比例却较高(13/140=0.09)。此例说明,入院机会不同选择的研究对象不同,对结果造成的歪曲。