- 社会偏好理论与社会合作机制研究:基于公共品博弈实验的视角
- 周业安等
- 5088字
- 2025-02-21 06:03:32
五、实验室实验研究的其他局限
除了学生被试偏差外,实验室实验在运行过程中还会出现一些明显的争议,这些争议包括被试自选择、特定情景的关注、早期经历、激励强度、文化差异等,而这些方面和实验设计直接相关。Levitt和List (2007b)认为,实验室实验存在伦理道德方面的顾虑。关于这点在实验经济学当中已经达成共识,即实验室实验必须遵守伦理道德规范,比如不能随意招募未成年人进行实验,假如需要招募,则必须经过相关部门进行伦理道德审查,并且实验的内容必须合法以及合乎道德。Harrison和List (2004)、Levitt和List (2007b)还认为,实验室实验可能受实验情景、被试自选择以及实验赌注大小等因素的影响。这些争议同样也来自其他一些研究者。针对这些争议,实验经济学家进行了大量的实验研究,以评估这些争议。
(一)被试自选择偏差问题
实验室实验通常采取招募自愿者的方式来获取被试。这些招募可以在学校进行,也可以在社会上进行。被试自愿参与实验,这点非常关键。因为实验室实验需要考察被试的自发决策,这种决策不受制于任何外界干扰,而仅仅取决于被试自己针对博弈本身的策略选择,即完全取决于自身的偏好和实验设计中给定的激励水平和方式。但也正是这种自愿参与可能带来自选择偏差。一些人批评说,愿意参与实验的被试可能恰恰是那种个性积极、亲社会程度更高、更具有合作精神的人,因而即便采取随机招募方式,被试池仍然是有偏的,这可能导致对实验结果的高估,比如对社会偏好的高估。
针对这些批评,一些实验经济学家进行了相关的实验研究,比如Alatas等(2009)、Anderson等(2010)研究了被试的自选择偏差,结果表明这种偏差并不存在。Belot、Duch和Miller(2015)在一系列独裁者博弈、信任博弈以及公共品博弈中发现,学生被试更接近同质经济人假定。同时他们发现学生被试的行为更稳定,因而更适合做科学研究。Falk等(2013)讨论了自选择效应,发现在一个独立现场捐赠中表现得更亲社会的学生并没有表现得更积极地参与实验室实验。Exadaktylos等(2013)并没有发现自选择效应,反而认为自选择被试是适合科学研究的群体。
当然,也有少数研究提出了不同看法。Remoundou等(2010)对比了实验室和人造现场的捐赠实验,发现学生被试和消费者被试的差异很大,学生被试中温情效应更明显,他们认为学生被试缺乏一般性。Slonim等(2012)系统研究了被试的自选择偏差问题,发现所招募的被试并不能代表所指的总体(试图研究的目标人口),收入较低者、闲暇时间较多者以及更有兴趣者更愿意参与实验,并且这些被试在自愿参与期间具有更高程度的亲社会行为。这会产生过度参与的现象。Slonim等(2012)计算出目标人口的参与率是23%,而Cleave等(2011)、Falk等(2013)计算出目标人口的参与率是12%, Krawczyk(2011)计算出目标人口的参与率是2%。从整个实验设计看,Slonim等(2012)的证据具有一定的说服力,但并不能说明自选择偏差是实验室实验有效性的否定条件。其中的原因是他们的目标人口也是学生群体,而从统计上说,学生群体的闲暇应该是同质的,而收入水平则取决于激励的强度。Korn和Hogan(1992)的实验结果表明,激励强度越大的实验局,被试的参与意愿越大。Krawczwyk(2011)设计了两种招募方式——强调货币激励和不强调货币激励,结果发现前者带来了更高的回应率,前者的被试更少参与非货币调查,并且也更不利他。但这只能说明激励与行为正相关,并不能说明自选择偏差。
当然,实验室实验在招募被试过程中要做到完全随机是非常困难的。不过Harrison、Lau和Rutström (2009)认为,虽然实验研究中的确存在非随机带来的随机偏差,但这并不影响人口学分布。一些研究者试图通过设计招募被试的程序来解决这一问题。Greiner (2004)指出在线随机招募机制是妥当的。
针对关于自选择偏差的争议,Guillen和Veszteg(2006)收集了一个实验室的(两年)74个实验597个实验局2408个被试的实验数据,进行分析后发现,人口学特征仅仅能说明结果的不到4%,而实验中的策略行为能够说明40%以上。这说明实验室实验中被试的行为主要是策略行为,自选择偏差的确存在,但不会对实验结果构成威胁。也就是说,这点自选择偏差不足以弱化实验室实验的有效性。
(二)特定情景的关注偏差
Levitt和List(2007b)认为,被试在实验室环境中容易受到监督和关注,因而可能高估亲社会行为。而在实地实验中,这种监督不存在,亲社会行为就显得更弱。Hoffman等(1994)在最后通牒博弈中设置了两种类型的程序:一是提议者随机产生;二是通过某种测试评分的方式。结果表明,分配10美元总禀赋时,前者85%的提议在4美元及以上,后者只有45%。在独裁者博弈中,前者20%的提议在4美元及以上;后者4%提供4美元,20%提供3美元,没有人提供5美元。在一个双盲独裁者博弈中(被试的决策只有本人知道,实验员和其他被试都不知道), 36个被试中只有4人提供了3美元及以上。他们认为被试的捐赠行为与程序、合同内容以及导语有关,是被试预期的结果,未必是社会偏好。Hoffman、McCabe和史密斯(1996)在此基础上进一步设计了匿名程序,发现随着社会距离的增大(匿名性的增强),捐赠水平下降了。由此进一步推知,可能是社会成员的相互关注增加了亲社会行为。Davis和Holt(2013)也同意,他人的关注可能改变被试的捐赠行为。List(2007)、Gneezy和List(2006)发现,礼物交换效应从实验室移至现场后就变弱了。Gneezy、Haruvy和Yafe(2004)研究了就餐者困境,同样发现就餐博弈中实验行为和现场行为存在差异。List等(2004)采取了一种随机回应技术,同样发现匿名程度与捐赠金额负相关。Haley和Fessler(2005)则在五个独裁者博弈中通过干扰被试的听觉和视觉来考察被试的反应,通过使用眼点技术(电脑屏幕上显示一双“监督之眼”)发现在出现眼点的情况下被试的捐赠多了两倍。Andreoni和Bernheim(2009)认为,被试在意社会对其的看法,通过实验发现,随着他人监督水平的上升,被试在独裁者博弈中对半分的结果增加了。Benz和Meier(2008)通过捐赠博弈、Laury和Taylor(2008)通过公共品供给博弈分别研究了实验室状态和自然环境中相同被试的行为差异,发现被试在实验室中表现得更为亲社会。
实验室作为一个特定情景,可让被试集中注意力,但同时也可以提高被试的受关注程度。被试主观上可能以为受到了监督,因而其行为可能表现得更符合实验设计。这是关注偏差的根源。但从另一个角度看,关注偏差仅仅提高了对亲社会行为的估计水平,并没有影响到亲社会行为的存在性。现有的实验证据并没有发现实验室实验中所展示的亲社会行为会在实地实验或者现实社会中消失。比如Franzen和Pointner (2013)发现被试在实验室中显示的亲社会偏好并没有因为工作经历的不同而出现显著变化。这说明关注偏差可以通过实验设计来纠正,而即便不能纠正,也不会影响实验室实验的有效性。只不过关注偏差提醒我们,在解释实验数据结果时需要谨慎地做出结论。
(三)情景偏差
不同的实验情景会影响被试的行为,这可被称为实验室实验中的情景偏差。Cooper等(1999)对比了学生被试和管理人员被试两个不同群体,在标准激励和情景类似的情况下,两者并没有显著差异;但假如激励变成递增型的,情景变成互动型的,则管理人员被试的反应比学生被试大。Carpenter、Burks和Verhoogen(2005)构造了具有社会框架的现场完成的最后通牒博弈和独裁者博弈实验,研究了普通学生、在职学生以及雇员三种类型的被试的表现,发现在最后通牒博弈中,在职学生的分成比例最高,雇员次之,学生最低;在独裁者博弈中,雇员的分成比例仍比学生高。他们认为社会框架起了很大的作用。Eckel和Grossman(2000)研究了真正的自愿者和在课堂上扮演的自愿者之间的行为差异,发现后者更大方,这说明情景因素在起作用。
情景偏差本质上是一种框架效应。被试进入某种情景,受制于该情景,把设定的情景视为一种框架来处理。一旦被试建立起了以情景为框架的决策模型,行为就会受到情景的激励。这反过来也可以说明,发现学生被试偏差的实验很有可能是情景偏差所致,如果剔除这一偏差,那么学生被试偏差可能就更弱。在实验室实验设计中,情景偏差可以通过正确的设计来弱化,乃至消除,从而保证实验室实验的有效性。
(四)被试早期经历偏差
行为经济学发现,人的早期经历会影响其后期的行为。在实验室实验中,被试的行为可能受制于其早期经历,因而导致实验数据产生偏差。Glaeser等(2000)通过实验和调查研究了信任与值得信任的问题,发现过去的信任经历、个体的社会互动以及地位等都会对信任水平产生影响。Murnighan和Saxon(1998)的最后通牒实验表明,儿童比成年大学生更大方。Harbaugh等(2002)则发现5~13岁的儿童、本科生和成年人进行复杂赌局实验时,儿童明显具有概率加权偏差。Harbaugh等(2003)招募了中小学三年级、六年级、九年级以及十二年级的学生进行实验,发现同样存在非零分配,并且没有发现年龄对信任和值得信任有影响。Hannah、Kagel和Moser(2002)完成了本科生和MBA学生两类被试群体的礼物交换实验,发现尽管两类被试都证实了礼物交换假说,但本科生被试所提供的努力水平比MBA学生被试显著低,他们认为这和MBA学生的早期工作经历有关。Güth、Schmidt和Sutter(2007)以德国媒体Die Zeit的5132名读者为被试进行三方谈判博弈实验,发现年纪大的人和女性更在意公平,网络使用者要比信函和传真使用者更自利。Casari、Ham和Kagel(2007)在一个拍卖实验中发现经历和人口学特征等对被试有影响。Bellemare和Kröger(2007)研究了不同群体的社会资本投资,发现年轻人、年纪大的人以及教育水平较低的人的社会资本投资水平较低;同时还发现劳动市场参与、收入和宗教等对投资没有影响。Hoffman和Morgan(2011)的实验发现,和学生相比,在互联网上做生意的人更加利他,更值得信任,更加互惠,也更诚实。
早期经历偏差仅仅表明个体的早期经历会影响其后期的行为。就实验室实验来说,在进行数据分析的时候,需要对早期经历的影响进行控制,这可以通过计量经济学方法来实现。因此,早期经历偏差尽管存在,但不影响实验室实验的有效性。
(五)文化偏差
具有不同文化背景的被试可能行为迥异。文化偏差本质上也是一种框架效应,特定的文化背景构成了一种实验框架,可以影响个体的决策。最著名的就是Henrich等(2001)所做的跨文化实验研究,他们建立了来自12个国家的16个具有不同文化的小规模社会被试群,其中包括3个搜食社会、6个刀耕火种的农耕社会、4个游牧群体和3个小规模定居的农业社会,并让其进行最后通牒博弈、独裁者博弈以及公共品博弈实验,这些研究发现,不同文化族群的被试都表现出一定程度的社会偏好,但不同族群之间差异很大,比如,在最后通牒博弈中,所有族群被试的平均出价范围为26%~58%,而工业社会的平均出价是44%,但拒绝率的分布是相当不同的。在公共品博弈实验中,工业社会的平均出资率为40%~60%,而这些被试表现出很大的差异,比如Machiguenga人的平均出资率为22%,没有一个被试是完全合作的。在最后通牒博弈中,Orma人中最常见的是50%和20%的支付,而Hadza人中最常见的是10%的支付。Henrich等(2010)指出,2008年某一顶级心理学杂志的一项调查表明,现有的实验研究中96%的被试都来自西方工业国家。这就使很多人以为社会科学家所推测出来的结论来自被试本身的性质,因而他们鼓励更广泛地研究属于不同文化族群的被试。的确,许多人开始进行跨文化的研究,比如Roth等(1991)基于以色列、日本、美国和南斯拉夫的学生被试进行了两人和多人谈判实验,发现不同国家的被试的行为存在显著差异,他们认为这可能是文化差异所致。Herrmann、Thöni和Gächter(2008)构建了16个来自不同国家和地区的被试群进行公共品博弈实验,发现差异很大,一些被试群针对低贡献者和高贡献者采取同等的惩罚,而另一些被试群则只惩罚低贡献者。Cameron等(2009)在腐败博弈中研究了澳大利亚、印度、印度尼西亚和新加坡的被试,发现差异很大,印度被试比澳大利亚被试更能忍受腐败,而新加坡被试的容忍度比预计的高,印度尼西亚被试的容忍度比预计的低,他们认为这可能与国家当时的制度变革有关。
从现有的研究看,具有不同文化背景的被试存在共性,也存在显著差异。这可能与文化所引起的框架效应有关。但正如我们在前面所说的,这种框架效应恰恰可以用来进行实验室实验研究,有助于在实验中发现更多的潜在的个体行为差异的决定因素。
(六)货币激励偏差
按照史密斯提出的诱导价值原理,实验室实验必须向被试支付相应的货币作为对其绩效的奖励。这样可以形成对被试的参与约束和激励兼容约束。但一些批评者认为,实验室实验中被试所得的货币太少,不足以构成有效激励,因而影响实验室实验的有效性。但这些批评遭到了实验经济学家的实验结果的有力反驳。Camerer和Hogarth(1999)总结了早期74个实验的研究结果,发现实验室中禀赋的大小不影响实验结果。Carpenter、Verhoogen和Burks(2005)通过最后通牒博弈和独裁者博弈研究发现(分别设置10~100美元的情景),实验室中禀赋的大小并不影响结果。Cherry、Frykblom和Shogren(2002)在独裁者博弈中发现10~40美元无差异。不过,Slonim和Roth(1998)发现虽然禀赋和出价无关,但禀赋越大拒绝率越低。这说明货币激励可能会对实验中被试的某些行为产生影响。我们认为货币激励偏差可以通过符合现实收入水平统计分布的设计方式来解决,比如我们的实验就引入了与现实收入不平等一致的实验室收入不平等结构,这样可以解决可能存在的被试的货币激励偏差问题。同时我们强调,实验室实验支付的是小时工资,平均水平看似低,但基本符合被试的现实收入水平,所以不存在关于实验室实验中货币激励可有可无的争论。