・讨论与评议・
国际关系的定量研究事件分析方法
———评《国家双边关系的定量衡量》
秦亚青Ξ
Ξ 秦亚青,1953年生,政治学博士,外交学院教授(北京 100037)。
①G ary K ing ,Robert Keohane ,and Sidney Verba ,Desi gning S ocial I nqui ry .Princeton :Princeton University Press ,1994.
  (一)《国家双边关系的定量衡量》(发表于《中国社会科学》2004年第6期,以下简称
《定量衡量》
)是一篇国际关系定量分析的论文,提倡的是一种科学的方法。科学方法相信客观世界的规律性和可知性,理论的可验证性,尤其是理论的可证伪性。一般来说,科学方法需要提出研究问题,梳理相关理论,确定研究假设,组织实际数据,验证假设真伪这样一些必需的
步骤。验证过程可以是定量,也可以是定性的,但其基本理念必须是以实践检验理论假设。
①虽然科学派、传统派和后实证派之间争论激烈,但科学的方法在行为主义革命之后得到了广泛的应用。定量研究更具自然科学的“硬”的特征,大样本分析成为客观性的一个标识。在国际政治学界,以美国密歇根大学为中心的庞大社会科学数据库为定量研究提供了重要的资源,负责该数据库的主要学者辛格等人成为定量研究的积极倡导者和实践者。在此基础上,涌现出大量研究成果。由于定量研究取得的成就,它已经成为国际关系学界不可忽视、甚至不可或缺的方法。辛格、布伊诺・德・梅斯奎塔等人对战争的研究,莫德尔斯基、戈尔茨坦对长周期的研究,奥根斯基等人的期望效用理论等等,都是采用了定量分析的方法,也确实产生了新的发现,甚至形成了重要的理论。
定量分析是国际关系研究的一种重要方法,事件分析属于定量分析的一种,有着几个主要特征。首先,它是一种归纳分析方法,即从个别出发以求达到发现一般性规律的目的。其次,它是一种描述性定量分析方法,不是推论分析。虽然事件分析对事件的赋值表现了一定的因果考虑,但本身不做直接的因果判断。也就是说,它只是试图描述两国关系的状态,而不以发现为什么出现这种状态为研究目的。第三,它是一种科学的分析方法。应为使用经验数据,强调判断和预测与现实的吻合程度。如果事件赋值能够达到相当的客观性,则符合科学测试的可重复性原则。正因为如此,设计合理的事件分析可以帮助我们认识双边关系并对其做出适度的预测。我国学者迄今为止对定量方法使用甚少。正因为如此《定量衡量》对于我国国际关系学科建设,尤其是在促进定量分析乃至方法论的多元化方面,
有着十分积极的意义。
《定量衡量》使用的是以双边关系中的事件为经验事实测定双边关系的方法。双边事件数据分析的基本理念是双边行为可以反映双边关系,双边关系的基本连续体是将冲突/敌对作为一端,将合作/友好作为另一端,然后对事件赋值并进行分析,以判断两国关系是趋于合作/友好还是冲突/敌对。事件分析类似天气预报,根据所掌握的可观察现象,判断和预测两国的关系。在冷战时期,美国学者对事件数据进行了收集和整理,并使用这一方法分析美苏两国关系等等。
(二)《定量衡量》引入了初始值,这是一个重要贡献。两位作者认为,《“冲突—合作模型”
与中美关系的量化分析》(以下简称《冲突—合作模型》
)将事件分值等同于关系分值,没有考虑初始关系状态。而《定量衡量》的方法最重大的贡献就是将历史考虑在内,设定了初始值P 0。仅从技术层面上来看,这似乎没有错,但这只是表层现象。《定量衡量》的真正深层意义在于背
531・
后含蓄的理论支撑。
学科需要理论和方法,方法是为理论研究服务的。事件分析方法属描述性分析。虽然描述分析方法在理论方面的要求比推论分析方法要低,但描述性分析的理论自觉同样不可或缺。实际上,无论是《冲突—合作模型》的分析方法,还是《定量衡量》改进后的分析方法,都包含了理论的内容,只不过作者没有自觉地将理论明示而已。比如,《定量衡量》作者认为,《冲突—合作模型》的致命缺陷是没有设定关系分值,这样一来,分析就失去了历史基础。实际上,《冲突—合作模型》设定了初始分值,即将P 0设定为常量。这在单纯衡量两个国家之间一对双边
关系的时候,并不会出现结构性偏差,因为,两国关系的初始值是一个常数(一般设P 0=0)。
①在没有与其他多对双边关系比较的情况下,这样预设是合理的。《冲突—合作模型》的作者这样设定,背后的理论是:无政府状态下的国家功能和国际关系在实质上是相同的。因此,其理论
内涵是现实主义,尤其是新现实主义设定的无政府条件下的一般性国家关系。
②《定量衡量》加入了P 0值。这只有在分析多对双边关系时,尤其是比较多对双边关系时,才会显示出解释力。而加入P 0值的理论内涵则是历史性和社会性因素,亦即两国关系的文化因素。社会事件本身是没有意义的,只有在语境之中才能产生意义。这也就是《定量衡量》所说的“在不同水平关系的基础上,相同事件对两国关系的影响力不同。”《定量衡量》作者认为,他们的改进模型反映了方法上的差异,但实际上这是方法背后的理论差异。如果说《冲突—合作模型》的基本理论是华尔兹的无政府
性和国家说,《定量衡量》的理论基础则更多地借用了建构主义理论,尤其是事件在霍布斯文化、洛克文化和康德文化的不同意义内涵,并以变化的初始关
系将其表现出来。《定量衡量》加入的初始值设定了衡器的零位,亦即嵌入历史的文化。
③同一事件,对于相互为敌的两个国家和相互为友的两个国家来说,可以具有完全不同的意义。
所以,《冲突—合作模型》和《定量衡量》的真正分歧,不在于是否设定历史性变量和初始分值,而在于方法背后的不同理论支撑。遗憾的是,无论是《冲突—合作模型》的作者,还是《定量衡量》的作者,都没有自觉地厘清理论。没有理论的指导,人们是无从观察的;而缺乏理论的自觉,方法也只能停留在工具的地位上。
(三)事件分析的核心是测量,测量的准确与否在于测量的客观性和准确性。因此,如何使赋值具有高度的信度和效度就成为事件分析的关键。信度是重复测量同一现象时得到相同结果的可能性。比如,测量人的体重,必须使用标准的磅秤,同一个人每一次测量的结果都是一样。如果使用不准确的磅秤,测量信度就会很低。效度是测量能反映真实程度的概念。如智商比学习时间的长度更能够测量一个人的智力水平。正是在这两个方面,《定量衡量》仍有改进的余地。
首先看信度。定量测量是否准确,信度至关重要。《定量衡量》在这一方面的设计较之《冲突—合作
模型》做出了重要的改进,对《冲突—合作模型》方法的简单化和结构性偏差进行了批评,并加入初始分值。这无疑是十分重要的一点,因为双边关系的衡器零位是双边关系的历史断面,而不是双边关系的现象本身。确定了这一点,也就使事件分析方法从简单的一对双边关系测量到多对双边关系的对比研究,加强了多对双边关系对比研究的信度。考虑了“事件积累”和“事件流动”两个因素,使衡器得到了校准,因而加强了测量的信度。因此,这是对
gary事件是什么
631・中国社会科学 2005年第1期
①②③在《定量衡量》的核心公式中,若设P 0=0,则I =I 0。
参见肯尼思・华尔兹《国际政治理论》(信强译,上海人民出版社,2003年)。
参见亚历山大・温特《国际政治的社会理论》(秦亚青译,上海人民出版社,2000年)。
《冲突—合作模型》方法的一种改进,在技术层面上,使信度有了很大的提高。
但《定量衡量》的信度仍有提高的余地。在比较多对双边关系方面较之《冲突—合作模型》的信度要高,这一点主要体现在《定量衡量》方法确定事件对双边关系的影响力这个关键环节上面。如果在这
个环节上测定的准确程度得以提高,整个方法的信度就会加强。现在,《定量衡量》使用的方法基本上是研究者个人人为的确定。这会造成强主观因素的强介入。如果对某一事件估计过高或估计过低,则会对整个双边关系的估计出现重大偏差。统计方法的一个基本技术是在研究设计中采取纠偏方式,将主观性强的因素弱化到最低程度。奥根斯基等人在设计国际关系研究的“预期效用模型”时,也使用了事件作为观察数据,其中有一个“意义程度(salience )”变量,测量事件对双方关系意义的大小。为避免研究人员本身的主观性,他们选择了10—20名相关人士将被研究事件在1—9范围内打分,然后取平均值作为事件的“意义程度”。这种纠偏方式虽然不能照搬,但有一定的借鉴意义。从方法论理论上讲,这是一个以“互为主观性”弱化一般主观性的方式。社会事实的主观性不可能完全消除,但从涂尔干开始,社会科学研究人员的一种共识就是,如果不同的人对同一现象具有相同的认识,这一认识就可以被视为客观的。“互为主观性”方法起到复证作用,可以减弱强主观性。
其次是效度。测量是否能够反映研究者所涉及概念的真实含义,这是事件分析的第二个重要问题。这里,可能出现误差的是涉及“内容效度”这一技术性较强的问题。《定量衡量》使用了单向测定的方法,这很可能加大判断和预测误差。正如《定量衡量》的作者所说的那样,两国元首的会晤在两国关系友好和不友好的情景之下意义是不一样的。这说明,两国之间建构的语境不同,事件的意义也就不同。那么,如何设定这个文化语境,也就是如何将双边“水平关系”(关系初始值)以比较客观的指数表示出来,就成为这一研究设计的关键。任何双边关系都是双方造就的。无论是敌对关系、竞争关系还是友
好关系,关键取决于双方的社会互动实践,任何一方在没有社会性质的环境之中都无法实现这样的“水平关系”。在这种实践中,双方产生对对方的知觉和概念,形成敌对或友好的文化。单方测定在内容效度上具有较大的内容缺失,容易出现误差。比如,测定中美两国的关系,并不是单纯的选定事件,而是选定对双方都有意义的事件,中美撞机事件就是如此。因此,对这类事件的编码需要根据双方相互的知觉和反应,事件的意义表现在这类互动之中。
《定量衡量》使用单向测量方式,即只测量双边关系一方的行为。只有在双方对同一事件的反应完全相同的条件下,单向测量才是准确的。可以减少误差的一个方法是双向测量。即测量双方对同一事件的反应。比如,一方直接加入以对方为目标的军事同盟,另一方是否也加入相对立的军事同盟,或是只是文字抗议,还是不采取任何行动?单方测定只能较好地反映一方对另一方的知觉,不能准确反映双方关系的性质。如果我们在测定双边关系的过程中只测定一方的反应,从理论上讲,最大误差可以是≤50%。加入双向测定因素之后,回归系数会小于现在的01772,但会更加真实地反映解释范围内的双边关系观察数据。
(四)《定量衡量》的目的是判断和预测,具有科学性和实用性,也会出现误判。在自然科学中,不确定性导致了无数预测失误,但即使错误概率较大的预测也比没有任何预测要强。社会科学的研究对象是人,预测的风险会进一步加大。定量分析出现过无数的错误,但它对国际关系学科研究的贡献也是有目共睹的。我们需要切实重视并使用定量分析的方法,同时,我们也应当记住波普尔在《历史决定论
的贫困》中的告诫,不要让定量以及测试成为“自我实现的预言”。要让思想和研究问题主导研究方法,而不应让研究方法支配思想和研究问题。
・731・讨论与评议