四、学生被试偏差与实验室实验的有效性争论

关于实验室实验的争议一定程度上来自对它的有效性的怀疑。从单个实验室实验的设计来说,通过精确的控制,并贯彻诱导价值原理与并行原理,是能够实现实验本身的效率的。但这对经济学研究来说显然不够,经济学家要求的是,一个经济学实验室实验的结果能够推广到非实验情景。迄今为止,很多经济学家同意,实验室研究具有较好的内部有效性,但外部有效性较弱。

(一)实验室实验的效率评价

如何才是一个好的实验?这涉及实验的评价问题。绝大部分实验经济学家都认可内部有效性和外部有效性的划分方法。按照Guala (2012)的定义,内部有效性是指一个给定的实验局中的因果关系解释;外部有效性是指这个给定的实验局中的因果关系检验结果能够一般化,以解释其他类似的环境。假如一个实验室实验是内部有效的,那就意味着受控条件下我们试图考察的变量关系得到了很好的考察。比如,在免费乘车难题中,一群人从事集体活动,其中一些个体想通过偷懒的方式来获取最大的个人利益。群体人数越多,免费乘车现象就越严重。按照标准的经济学理论的预测,当社会成员数趋向无穷时,集体活动为零。奥尔森提出这个难题后,一直难以证伪。我们可以在社会中观察到各种免费乘车现象,但我们很难基于自然数据建立起个体免费乘车行为和公共品供给之间的映射关系。通过实验室实验就可以解决这个问题。一个标准的公共品博弈要求若干被试参与某项集体投资,被试可以把拥有的禀赋投给自己的私人账户,也可以投给公共账户。免费乘车动机导致无人投资公共账户。而迄今为止的公共品自愿供给实验证伪了该命题。

显然,公共品自愿供给实验是内部有效的,通过被试的投资决策能够观察到被试愿意投资公共账户的强度,而这可以显示被试的内在亲社会动机。传统理论之所以认为免费乘车是一个难题,是因为其忽略了社会成员的这种社会性。行为和实验经济学家把被试的这种社会性提炼为社会偏好,意指除某种自利偏好之外的具有亲社会性的偏好,比如利他、互惠等。迄今的公共品自愿供给实验发现,被试总是会拿出相当的份额投资公共账户,并没有表现出完全的免费乘车。更重要的是,假如某些社会成员出现免费乘车问题,那么被试会实施惩罚,即使这一惩罚需要付出成本。有成本的惩罚行为这一发现更加凸显了实验室实验的内部有效性,它说明实验不仅可以证伪某些已有的命题,而且可以发现一些新的问题,并且受控条件下我们需要检验的因果关系在其中都能得到非常有效的检验。

(二)学生被试偏差的争论

反对实验室实验的人辩护说,实验室实验具有内部有效性这点并无疑问,关键在于实验室实验缺乏外部有效性。Sears (1986)把对学生被试的使用视为一个“窄数据集”,即使是一些实验经济学家对实验室实验的外部有效性也深表疑虑,比如Harrison和List (2004)、Levitt和List (2009)就认为,实验室实验在现实性方面还比较欠缺。Guala (2003)认为,实验室实验具有局部主义的特征,只是针对特定的局部知识,这就必然会影响实验结果的一般化。如果要摆脱这种局部观,那么就需要采取相应的实验设计理念和方法。对实验室实验的外部有效性之疑问主要来自学生被试难题。由于实验室实验大多数情况下都是招募学生被试来完成相关的实验研究,对实验室实验的指责也就由此产生,核心问题如下:学生被试能否代表真实的社会成员?

1.学生被试的有效性:支持方的证据

直观上看,无论是本科生还是研究生,似乎都和真实的社会成员有着很大的不同,这不仅仅指年龄上的差距,还有社会生活经验上的差异。学生涉世未深,比较单纯,体会不到社会生活的复杂和艰辛,因而在做决策的时候难免幼稚、冲动。事实果真如此吗?一些研究者针对学生被试和非学生被试展开了一系列的研究,结果发现两类被试在实验室中的行为并无本质差别。例如,Alpert(1967)研究了有商业经历的被试群和没有商业经历的被试群(包含学生被试),发现没有显著差异。Dejong等(1988)进行了一个类似的最后通牒博弈实验,发现学生和市场机构合伙人之间没有显著差异。Dyer等(1989)在一个拍卖实验中发现,学生和专家都会出现“赢者的诅咒”,两者行为无显著差异。Peterson(2001)基于已有的实验数据进行分析,发现学生被试和非学生被试在同质性方面虽有差异(前者同质性更强),但在行为上并没有系统性的差别。Harbaugh等(2003)招募了中小学三年级、六年级、九年级以及十二年级的学生进行实验,发现同样存在非零分配,并且没有发现年龄对信任有影响。Sutter和Kocher(2007)招募了8岁、12岁、16岁、20多岁四个年龄段的学生,30多岁的职员,60岁及以上的退休人员进行信任博弈实验,发现信任程度最初随年龄增加而上升,但进入成年后保持不变,值得信任的程度各年龄段差不多,学生被试和职员以及退休人员之间无显著差异。Güth、Schmidt和Sutter(2007)以德国媒体Die Zeit的5132名读者进行三方谈判博弈实验,发现年纪大的人和女性更在意公平,网络使用者要比信函和传真使用者更自利,学生被试和非学生被试的表现则没有明显差异。Benz和Meier(2008)研究了相同的被试在实验室和现场环境中的捐赠行为,发现两者是显著相关的,相关系数在0.25和0.4之间。Depositario等(2009)招募了学生被试和当地居民被试作为两个被试组进行拍卖实验,结果发现两个被试组没有显著差异。Andersen等(2010)研究了学生被试和非学生被试的风险偏好和时间偏好,发现其在时间偏好方面基本无差异,在风险偏好方面有一定差异。Baran、Sapienza和Zingales(2010)同样基于信任博弈研究了被试在实验室和现场的差异,发现没有显著差异,并且发现社会规范对实验室的结果没有影响,对现场的结果有影响。Brañas-Garza等(2011)基于五个常见实验招募社会代表性人口,发现其与学生被试在社会偏好方面没有显著差异。Falk等(2013)基于信任博弈比较了代表性人口的实验组和学生被试组,没有发现两者之间在社会偏好方面的显著差异。Alm等(2011, 2015)基于学生被试和职员被试进行了税收遵从实验,并没有发现两类被试出现显著的行为差异。Cleave、Nikiforakis和Slonim(2011)基于马堡大学1173名学生分别进行了课堂实验和实验室实验,在社会偏好和风险偏好方面没有发现显著差异。Franzen和Pointner(2013)采用误导信函技术,追踪在校期间参与过独裁者博弈实验的两组被试在其毕业4~5周后(第一组)以及两年后(第二组)的反应,发现被试在实验室中显示的亲社会偏好并没有因为工作经历的不同而出现显著变化。Croson(2010)总结了31项关于学生被试和非学生被试的差异的研究结果。Fréchette(2012)总结了一些研究者针对不同被试组的研究结果,发现绝大多数研究都没有发现显著差异。

2.学生被试偏差存在的证据

也有不少研究发现,实验室实验中的确存在学生被试偏差问题。Cooper等(1999)对比了学生被试和管理人员被试两个不同群体,发现在标准激励和情景类似的情况下,两者并没有显著差异,但假如激励变成递增型的,情景变成互动型的,那么管理人员被试的反应比学生被试大。Hannah、Kagel和Moser(2002)进行了本科生和MBA学生两类被试群体的礼物交换博弈实验,发现尽管两类被试都证实了礼物交换假说,但本科生被试所提供的努力水平比MBA学生被试显著低,作者认为这和MBA学生的早期工作经历有关。Bosch-Domenech等(2002)通过选美竞赛博弈实验发现不同被试池的被试的反应存在显著差异,但和学生被试相比,普通人口被试的反应的差异更大。Fehr和List(2004)研究了CEO被试和学生被试的信任问题,发现前者更容易信任别人,也更容易被他人信任。Carpenter、Verhoogen和Burks(2004)构造了具有社会框架的现场完成的最后通牒博弈和独裁者博弈实验,研究了普通学生、在职学生以及雇员三种类型的被试的表现,发现最后通牒博弈中,在职学生的分成比例最高,雇员次之,学生最低;在独裁者博弈中,雇员的分成比例也比学生高。他们认为社会框架起了很大的作用。Montmarquette等(2004)做了一个团队激励实验,发现管理者更少免费乘车,但学生的学习效应更大。Glaser等(2005)发现了专家和学生在决策时的显著差异,专家的偏差更大。Bellemare和Kröger(2007)发现学生被试和普通人被试之间存在显著差异,学生被试的信任和互惠程度更低。Carpenter、Connolly和Meyers(2008)研究了独裁者博弈中的学生被试和社区成员被试,发现二者存在显著差异。Alatas等(2009)研究了印度尼西亚学生和公职人员对腐败的容忍度,发现后者对腐败的容忍度更低,他们认为这和被试的生活经历有关。Andersen等(2010)分别在实验室和实地实验环境中研究了不同人群的风险和时间偏好的差异,发现两种情景下被试有差异,这些差异和个体特征有关。Anderson等(2010)采用序贯囚徒困境博弈实验,招募了100个本科生、94个非学生成年人以及1069个成年司机学员。他们发现成年人之间的涉他偏好无显著差异,但学生和成年人之间存在显著差异,学生的涉他偏好更弱。Hoffman和Morgan(2011)的实验发现,和学生相比,在互联网上做生意的人更加利他,更值得信任,更加互惠,更诚实。

从关于学生被试偏差的研究结果看,大部分都认为,学生被试和非学生被试在最后通牒博弈、独裁者博弈以及公共品博弈中没有表现出显著的行为差异,而在信任博弈、投资博弈以及个体决策研究中则表现出一定的差异。这说明学生被试偏差是相对所研究的问题而言的。对于一些人类本身具有的偏好特征而言,被试偏差可能并不存在,或者即使存在,也非常小,并不显著。而对于一些后天习得的偏好特征,则可能会出现显著的学生被试偏差。从现有的文献看,以信任博弈为例,信任是后天习得的,对于缺乏社会经历的学生而言,对信任的理解以及对什么人值得信任的看法可能完全出自本能,而非学生被试就可能融入其社会经验,因而与学生被试存在显著差异。再比如企业决策、投资决策等都依赖社会经验,这些对学生被试来说则是缺乏的,只能凭直觉决策。但反过来说,即便是这些依赖社会经验的博弈实验,学生被试仍然是重要的,因为学生被试和非学生被试的行为差异正好展现了后天习得的重要性,由此我们可以研究后天的直接经验和间接经验对行为模式的影响。当然,无论争议多大,正如Gächter (2010)所言,对学生被试的研究至少是好的基准研究。本书是以公共品博弈实验为基础的,对被试的社会经历要求不高,我们的意图是研究被试之间的合作行为,无论被试是否具有社会经历,都可能展示出一定的合作行为。因此对本书来说,学生被试偏差并不构成一个问题。