文献来源:Gary King.1995. “Replication, Replication.”PS:Political Science and Politics, 28, pp. 444-452.
作者简介:加里·金(Gary King),政治学家、统计学家,哈佛大学政府系韦瑟黑德三世(Albert J. Weatherhead III)讲席教授(政观注:哈佛大学所设立的26个著名校级讲席之一,政治学巨擘亨廷顿生前也是该讲席教授),量化社会科学研究中心(Institute for Quantitative Social Science)主任,美国科学院与美国艺术与科学学院院士,其著作等身,在社会科学方法论、选举行为以及网络监管等研究领域做出大量贡献,其与基欧汉(Robert Keohane)和维巴(Sidney Verba)合著的“KKV”(《社会科学中的研究设计》)在国内广为流传,是当下从事社会科学研究入门的必读书目。
主页:https://gking.harvard.edu/
在政治科学学术共同体内,以实证研究为导向的政治科学家需要获取必要的数据来重复现有的研究,以了解、评估并以此为基础开展下一步工作。但是遗憾的是,学界现行的规范并不鼓励这样做。在这篇文章中,作者旨在面向师生、论文作者、期刊编辑等群体提出重复验证的规范建议。
如果你想要了解或者评估一项实证研究,最好的方法就是完全弄懂从数据产生到结果分析的完整、精确的过程,但是受制于一些条件制约,其或多或少面临着实证研究的困境。对量化或者质性研究者来说,你需要回答以下这些问题:受访者是如何选择的?谁做了访问?提问的顺序是怎样的?用了什么样的统计程序?哪些是原始编码,哪些运用了转码?等等,显然全部重复上面的所有问题是不切实际的。
然而对公开发表的量化研究作品来说,其遵循着一套相近的规范,因此模仿的要求就是能够进行重复验证,但它并不意味着要求每一个人都能重复整篇文章或者整本书的结论,而是要求在原则上能根据一篇文章使用的方法能重复出它的结论。这样的重复验证标准既适合定量研究也适合于定性研究。
事实上,简化真实世界的研究涉及两个过程,第一步是通过对必要的量化或质性数据描述来代表真实的世界;第二步是对这些数据展开分析。同时,政治科学研究者更多地通过自己搜集的数据而不是像经济学研究者那样更多依赖于政府公布的数据,因此就这点而言,政治科学家们的重复验证将会是更加充实的。
当然,除此之外,还有一个自利性的重复理由,那就是越少能被重复验证的文章的阅读量会更少,引用率也会更低,其所涉及的主题也会被其他学者更少地研究。
由于学者、监管者、评论人与编辑在鼓励或指定模仿标准中扮演着至关重要的角色,因此作者分别向这些群体提出如下可供参考的解决方案。
对作者来说,如果他们想要自己的作品能被阅读、被理解,遵循重复验证的规范是重要的一步,它也将有助于研究者即使忘记方法细节时也能继续他们的工作。因此,能在文章、书籍或者论文中展现关于数据的搜集、编码、分析以及报告可能是仿作的重要标准,然而遗憾的是,无论是既有的期刊还是书籍都未能有提供这些“财富”的空间,当然,电子档案比纸质媒介传播起来更好。在这方面,普渡大学的公共事务视频档案(Public Affairs Video Archive at Purdue University,PAVA)和密歇根大学的跨校政治与社会研究联盟(Inter-University Consortium for Political and Social Research at the University of Michigan,ICPSR)能满足搜集数据的标准。
重复验证的第一部是建立需要重复验证的数据库(集)。对量化研究者来说,这其中可能包括了原始数据、专门电脑程序、编程代码或者现有的公开、可摘录的数据以及解释性注释(例如“read.me”类型的文档)。如前所述,这些数据可以通过PAVA或者ICPSR两大数据库进行申请。
对终身教职与晋升评审委员会而言,这一组织虽然是评判申请人在学术上的贡献,但如果在评审过程中坚持纳入重复验证的标准将有助于他们更好地理解并扩展这些研究。
对研究生项目来说,纳入重复验证的标准将有助于强化他们从事学术研究的基本能力乃至激发他们的原创能力。比如,对大多数研究生来说,博士学位论文是其学术生涯中第一部作品,它本意致力于扩展学术共同体的原创贡献。为了使这些效用最大化,研究生项目要采用要求学生提交能够进行再次验证的数据库这一标准。以哈佛大学政府系来说,当学生应用量化数据写作论文并申请博士学位时,必须提交可供验证的数据库。
对书籍与期刊的编辑以及评审人来说,坚持一个能重新验证或者复制结论的标准能最大化其影响力。最简单的方法就是要求作者在其作品的脚注之处写明他们数据库的来源与存储地方以及它们能被获得的时间。当然有些期刊的要求与投稿人的要求也会发生冲突,学界内在一定时间内公开数据存在着争议,美国政治学会(American Political Science Association,APSA)的政治学方法论分会(Political MethodologySection)最长允许五年的数据保密期,而美国科学院(NationalAcademy of Sciences)统计学委员会则建议在论文评审的过程中就公开数据。
对待第一次发表或出版,你可以向主管机关申请数据保密的权限和时间,但是这不应该是永久性和常态化的。根据仿作的规范,你有义务公布在发表论文中使用的数据。举个例子,如果你用了300个数据中的10个,那么你就应该公布这10个数据;如果你有5种类型的变项但只选用了其中两种,你就应该提供重新编码的这两种数据。如果你有1500个观察值并且在分析中用了这其中的1000个案例,你也需要提交这1000个数据。当然你也可以选择提交所有的数据,这将使得你的工作对学术共同体来说更为宝贵。
目前来看,这些正式政策日益受到期刊和出版社的支持,近年来,美国政治学杂志(American Journal of Political Science)、政治分析(Political Analysis)的主编们要求所有文章都必须在脚注中说明数据的来源,这项要求也几乎没有受到投稿人的抵制。此外,像《英国政治学杂志》(British Journal of Political Science)以及《国际互动》(International Interactions)等期刊也采用了类似的政策。密歇根大学政治与法律出版社要求所有作者必须注明他们的数据来源,剑桥大学出版社中制度经济学丛书业已采用此项规定。
美国国家科学基金会(National Science Foundation,NSF)政治学评审组也明确要求获得资助的项目中这些数据在授权期满一年后应当存档在主管官员批准的数据库中。此外,诸如国家司法研究所(National Institute of Justice,NIJ)等机构也有类似规定。
近年来,在政治科学学术圈内对能够进行重复研究的政策进行了广泛的讨论。在政治学方法论研究者那里,这项规定得到了热烈的赞成和拥护。1994年,美国政治学会中的方法论分会一致通过了所有期刊都必须要求投稿人注明数据的获得来源这一决定。同年,美国政治学会下属的比较政治分会(Comparative PoliticsSection)在审慎的考虑过后也采用了类似的规定。
美国政治学会的编辑部门和其他分会对此也进行了广泛的讨论,从这些论坛的回应来看,在整个学科中对设立重复验证这一标准的支持很强。许多富有洞察力的学者提出了实施重复验证策略的具体方法。因此,作者在本文提出的建议也得到了极大的改进。
最后,作者在文末对一些问题进行了回答,政观在此做部分摘编:
Q:制定重复验证的标准之后会抑制研究个体搜集大型与复杂的数据意愿吗?
A:调查者通过搜集数据并向学术共同体提供这些数据来获得认可,这种认可的形式是多样的。因此学术界通过他们的贡献去加以评判,所以通过贡献一份能重复的数据来增加文章的重要性更能强化作者获得的认可。但是也存在一些风险,这些风险相反并不是某人的观点被窃取,而是在写作中忽略了最常见的引用,这也是大概率的风险。因此,提交能够重复验证的数据能显著地降低发生这种风险的可能性。而且正如前所述,作者可以选择只提交所用到而并非全部的数据集,在其他情况下还可以申请在一定期限内对数据的保密。
Q:所有期刊和书籍在同一时间采用同一规定不是更好吗?
A:这样想法固然很好,但是每一本期刊都有不同的规定和制度,不同的风格,不同的标准乃至不同的方法论种类,也有不同的编辑,不同的审稿人,所以不应该对它们采取不同的规定感到诧异。
Q:如果期刊需要遵守可供复制相同研究的标准,那么是否存在作者将作品投递到其他刊物,或者在正式书稿准备好之前不予发表的可能?
A:对某些作者来说,这种情况可能是存在的,但就目前而言,在已经采用上述政策的期刊中还没有遇到这种情况。此外,很多出版社采用同样的规定,没有哪一家能拒绝遵守NSF制定的规则。因此,一旦这项规定能被充分解释,作者可能就会明白这符合他们的利益。
Q:如果我提供了数据,是不是你也可以有机会发现我的错误然后告诉每一个人?
A:诚然这种方式将导致我们更容易地暴露自己的错误。但是我们做政治科学研究是为了更深入地了解政府与政治。我们必须给其他人证明我们犯错的机会,尽管不是所有的批评都会让我们感到高兴,但是这样至少证明了我们的研究被认真对待。
Q:为什么我们担心自己可能会重复已有的成果呢?如果我们将相同的测量标准应用于新的领域、国家或时间段,是不是在探究更重要的问题?
A:好的科学研究需要我们能够重复既有的研究成果,而且能够让其他学者在新的情境下采用相同的方法发现变化。后者虽然更为有趣,但是前者也格外重要。事实上,只要学者得出更为确定的结果,我们鼓励他们在新的情境下展开探索。显然,通过数据去重复先前的研究要比在新的条件下探索更为容易。更为重要的是,估计因果效应的标准做法是每次改变一种变项,以便我们能够将个别变化与特定效应联系起来进行判断。
编后记:在这篇文章中,Gary King教授旨在回答政治科学学习者如何进行量化练习乃至研究的困惑,也尝试提供政治学界重复乃至检视既有研究结论的准则。这篇文章虽然发表于1995年,迄今已有23年,但对当今国内从事政治学研究科学化训练的青年师生来说仍然具有指明灯般的意义。
领取专属 10元无门槛券
私享最新 技术干货