实证研究是什么?怎么做?为什么你一定要做一次?
作者:刀熊
我在出国读博士以前虽然也做了参与了一点科研内容,但是真正让我对学术发生兴趣、真正开始理解学术研究还是在来美国接触了实证研究之后。
如果你是个社会科学研究者,我认为你一定要尝试自己设计一次实证研究,哪怕它不是你的主要研究目标。因为设计、执行自己创造出来的实证研究,实在是太有意思了。
打个比方,这种能够自己设计、执行、验证自己的研究的感觉,就好像艺术家从头到尾经历几年精心打磨出来一件艺术品,就像建筑设计师从无到有、从想象到现实看见自己脑中的图像矗立在大地上。
它实实在在的是你的创造,而创造一件东西过程中的快感和创造后的成就感恐怕是没有任何其他事情可以替代的。
什么是实证研究?
实证研究,empirical study, 是基于对事实、客观的现象、数据进行系统的验证,而得出问题结论的研究。实证研究的三大特征是以证据为依托、有数据、和可以验证和重复验证。看一个研究是不是实证研究,最直接的办法是看它文章里有没有呈现data (数据)——这里的数据并不单指“定量”数据,而是既包括定量也包括定性的数据。所以实证研究从数据类型上分可以分为两种:
定量型实证研究
定性型实证研究
有人会以为只有定量的研究才是实证研究,这其实是误解。访谈的对话、实地观察的笔记、archival data(档案数据), 这些都是数据,只不过是定性的数据。
什么研究不是实证性研究呢?没有数据的,不依托现实中验证的证据的。比如理论构建的研究、文献综述型文章等。没有收集数据、呈现数据、经数据分析的研究不是实证研究,而是conceptual study(概念研究), 或者theoretical study (理论性研究)。
实证研究重要吗?
重要,特别重要。最大的原因是,这是目前为止社会科学领域最被广泛接受、最流行、最常见的研究类型。其次,功利一点的原因是,这也是社会科学领域学者们最容易发文章的类型(英文期刊)。或者,从趋势的角度看,在可预见的接下来几十年,实证研究的方法应该继续成为社会科学届最重要、最主流的研究方法。而国内这几年实证研究的兴起和快速发展更加印证了这一点。
实证研究怎么做?
简单来讲,实证研究最核心的工作是以下这三步:
第一步:你要确定一个研究问题。
这个研究问题最好是你感兴趣的,要是非常具体的,要是可以检验的。比如, 以下都是可以作实证研究的题目:
提升电费能够促进人们节约用电吗?
每年年初制定计划的人会比不做计划的人工作效率更高吗?
在医院工作的人,是比不在医院工作的人更容易生病还是更不容易生病?
数学好的人语言能力会更差吗?
随着年龄增加,人的同情心会逐渐增加吗?
一个非营利组织的筹款数额与员工对工作满意度有相关性吗?
明星片酬越高的电影票房越高吗?
怎么做数据分析
养狗的人比养猫的人更愿意跟其他人社交吗?
学生自发上知乎的频率跟学习成绩成相关性吗?
以上是我随便举几个例子, 你会发现, 实证研究的主题经常是非常有趣,非常接地气的,跟我们生活息息相关的,所以我相信很多学者都是跟我一样,因为自己做了实证研究而对研究这件事本身发生了巨大的兴趣 。
而另一方面,当你自己做过实证性研究,你会发现你看待周围人和事物的方式或多少发生一些变化,你相当于给自己的思维加了一道升级的新设备,它会帮助你更有力的思考很多现实问题。你还会发现,其实我们生活中很多人们习以为常、或者习惯性接受了的观点,未必是经得起推敲的事实,因为它们从未经过系统验证。
我们中国悠久的历史和沿承的文化决定了我们很多知识是通过经验、习俗、或口耳相传来积累的,而不是经过系统的、以事实为依据的科学验证来积累的。那么这就意味着可能有不少的流行的观念、习惯、想法都还没有经过验证,都需要有数据去支持,都值得去展开
质疑和进一步探讨。这也意味着,作为一个社会科学研究者,在国内做实证研究,其实还有大量“低垂的果实”没有被开采,大量的贡献等待着学者做出,正是被需要的好时候。
第二步:你要自己设计出验证题目的过程。
这其实就是写proposal(计划书)的过程。你要在这一步里思考怎样才能够验证你的研究问题,而具体来说,也就是收集到什么样的数据能够帮你验证你的研究假设。
从这一步开始,你要做的工作就越来越有意思了,你开始通过你自己的能力去创造一个从未有过的过程。这里面需要你具备很多基础知识和思维能力,但是它诱人的地方在于,你设计的研究,会跟其他任何人设计的都不完全一样,那是你做的,你创造的,你把握的,一定带你着思维方式、教育背景、训练背景的独特烙印。这个研究可是真真正正、从里到外印着你名字的作品。
比如说,“在医院工作的人,是比不在医院工作的人更容易生病还是更不容易生病?”这个题目,是我有一次去医院的时候忽然想到的,虽然不是我自己的研究范围,但是我觉得是一个很有意思的话题。这里我好奇的并不主要是医院工作人员更容易被传染、或者免疫能力
更强的问题,我当时在医院里的感受是,所有的工作人员每一天都会接触很多的病人、谈论很多的疾病名称、看到很多的病痛症状。他们谈论、思考、接触这些疾病和症状的频率,大概是我们普通人的好几十倍。我们平时也就是偶尔会谈论起某个人生病了,或是偶尔看到别人生病的症状。所以我特别好奇这种”谈论”和“接触”对人的心理暗示有没有影响,人会不会因为每天讨论的病情很多,就更容易得某种病呢?
要想真的用实证方法来验证这个问题,不同的学者的设计思路一定会不一样。比如,到底什么样的数据类型才能回答问题?定量还是定性的方法更有效?访谈还是问卷的方法更适合?如何测量“更容易生病”这个变量?选取多少个医院的工作人员才够?选哪里的医院?要不要选多家不同类型的医院?要不要把不同的工作人员(比如医生、护士、其他工作人员)区分开来研究?….这些方面都需要考虑,具体做起来每个学者也都会有不一样的设计。
更系统一点说,这一步要想把研究设计得精彩,意味着我们需要有以下几个方面的知识( 后续专栏文章会分别梳理的模块):
Sampling (抽样): 什么是样本? 有什么不同的抽样方法? 抽样背后的逻辑是什么?什么时候
应该用什么样的抽样方法才合理? 定量研究和定性研究sampling方法有何不同?