循因果之道,启智慧之旅

作者: 王永钦

循因果之道,启智慧之旅0

约书亚·安格里斯特。图/法新

今年10月11日,《精通计量:因果之道》一书的作者约书亚·安格里斯特(Joshua Angrist),以及大卫·卡德(David Card)、吉多·因本斯(Guido Imbens)一同获得了2021年度诺贝尔经济学奖。他们对自然实验和因果识别方法的探索与推广,极大地改变了社会科学的实证研究范式,瑞典皇家科学院评价道,“自然实验可助我们回答社会的重大问题”。

如今,基于自然实验的因果识别方法已成为经济学者工具箱里的必备实证工具。如何学好用好这个工具,用来回答更多有趣有意义的社会问题,最好的路径就是从安格里斯特这位被中国经济学界称为“安神”的这本书开始学习。

因果识别与社会科学的“可信度革命”

科学研究是一个不断从现象中寻找理论、验证理论,再用理论解释现象、指导实践的认知过程,因此,对理论的检验是至关重要的。科学大致分为自然科学和社会科学,自然科学的研究对象是自然界,主要是人类之外的主体。自然科学的理论相对来说更具有可被验证的条件,因为科学家们可以在实验室里做实验,可以控制诸多因素。而社会科学主要研究人,而对人很难做实验,因此社会科学研究有很大的限制。对人做实验起码有两方面的困难,一方面是伦理问题,举例来说,我们不能让社会中一半人接受教育,让另一半的人没有教育机会,然后来分析教育的效果如何,这显然不符合伦理道德,不符合公平的考虑。另一方面,哲学方法上也使得社会科学很难做实验。在自然科学里,可以把一块石头切成两半去分别做实验,因为切分不会改变石头的物理和化学性质,且切分后的对比观察有利于分析不同实验的效果。但在社会科学研究中,无论如何我们都无法找到两个行为模式完全一样的个体,人有主观能动性,即使双胞胎也会有别。这造成了社会科学中“因果推断的基本问题”:同一个个体要么在实验组里,要么不在实验组里,不可能同时“在”和“不在”。比如中国改革,我们现在处于“改革”的状态中,就看不到“不改革”的状态,从而无法同时直接比较“改革”和“不改革”的结果。时间之箭是不停流逝的,只有一条实现路径,数据上我们永远观察不到其他的可能路径,即所谓的“反事实”(Counterfactuals);所以,在社会科学中做因果推断是非常困难的。

那么,一个理想的实验是什么样的呢?举医学的双盲实验为例,如果我们要检验一种新冠的药有没有效果,可以把人群随机分成两组,一组使用新冠药物(处理组),另一组使用看似一样的安慰剂(控制组),过后观察这两组人的差别。实验室和随机实验是自然科学里的一个黄金规则。经济学也在越来越多地使用随机实验,两年前的诺奖得主阿比吉特·巴纳吉(Abhijit Banerjee)、埃丝特·迪弗洛(Esther Duflo)和迈克尔·克雷默(Michael Kremer)对此作出了很大贡献(有意思的是,安格里斯特是迪弗洛在MIT读博士时的导师)。但大规模地开展社会实验有困难,在回答许多重大社会问题时,随机实验方法有不小的局限。

由于因果识别技术的不足,经济学长期一直以理论研究为主。因为实证中用观测数据得出的结果,通常是相关关系,而非因果关系,对这些结果的解释尤其需要先有理论依据。值得庆幸的是,上世纪90年代后,经济学因果识别的“可信度革命”开始了。代表人物就是包括本书作者在内的今年三位诺奖经济学家。大卫·卡德和2019年不幸早逝的经济学家艾伦·克鲁格(Alan Krueger)开创性地借助自然实验研究最低工资、教育和移民等问题,约书亚·安格里斯特与吉多·因本斯系统地构建了识别“局部平均处理效应”(LATE)的框架。由此迎来的这一场“可信度革命”(Credibility Revolution)使经济学具备更高的科学性;从社会科学方法史的角度看,这场革命堪比自然科学领域的“哥白尼革命”。

因果识别之“巧”:以世界为“实验室”

因果识别方法的精巧,从几个具体的例子中可见一斑。第一个例子是大卫·卡德与艾伦·克鲁格关于最低工资法的著名研究。在美国,最低工资法是很重要的政治议题,民主党一般主张提高最低工资,保守派的共和党通常认为政府不应干预劳动市场,反对提高最低工资,他们认为尽管政府本意是好的,但提高最低工资反而会害了工人。在上世纪90年代之前,经济学理论大多认为提高最低工资会导致企业减少雇佣工人,最终增加失业,这似乎毋庸置疑。

但这两位学者开展了一个让所有人惊讶的研究。他们选择了美国两个相邻州:新泽西州和宾夕法尼亚州。其中,新泽西州在1992年4月把每小时最低工资从4.25美元提高到了5.05美元,宾州则没有变化。然后用问卷调查收集了两个州的快餐业劳动就业数据。由于两个州相邻,快餐店所处的经济和市场环境相似,主要区别在于这两个州的最低工资政策。因此对新泽西州快餐店在1992年4月前后的就业作差,差值来自提高最低工资的影响和其他的经济社会等因素,对宾州前后作差,差值则只来自与新泽西州相似的经济社会等因素,没有最低工资的影响。那么两个差值之间再作一次差,得到的就是提高最低工资对就业的影响了。这种奇妙的方法就是著名的双重差分法。卡德和克鲁格教授的这一研究有重要的社会意义。他们发现,与没有提高最低工资的宾州相比,新泽西提高最低工资之后,就业非但没有下降,还略有上升。这一发现颠覆了经济学家和政治家的成见,对经济学研究方法的发展和政策研究都产生了巨大的影响。

结合中国的情况再介绍一个双重差分法在中国的应用研究。该项研究的作者是西北大学教授钱楠筠(Nancy Qian),也是安格里斯特在MIT指导过的学生。她的问题是,性别失衡的原因是什么。男女性别失衡是一个很重要的社会现象,这个现象导致了一系列社会经济问题,如哥伦比亚大学魏尚进老师的一系列研究发现性别失衡是高房价、高储蓄和收入差距等问题的重要原因,所谓“丈母娘经济”。对性别失衡的成因有很多可能的理论假说,譬如认为中国儒家传统重男轻女,这是文化现象;譬如男女挣钱能力不一样,这是经济原因。其他的假说可能还有100种,但重要的是我们需要用因果关系识别出什么是最重要的原因。

钱教授用双重差分方法找到了答案。她运用中国的市场化改革作为自然实验。市场化改革之后,部分商品价格由物价局定价转变为市场定价。钱教授选择了两类农村地区,一类农村地区适合于种茶叶,如像浙江一些山区;另外一类地区适合种水果,如山东的平原地区。男性与女性在两种作物种植采摘中具备不同的比较优势:女性心细,往往更适合采茶;男性体力好且擅长攀爬,更适合果园的劳动。市场化改革由市场定价之后,在不同地区,男孩和女孩的经济重要性差别拉大。在茶叶种植区,由于茶叶价格市场化,女孩相对于男孩经济重要性提升,反之在果园地区男孩经济重要性强。结果她发现,市场化改革之后,产茶区性别失衡下降了,而果园区性别失衡加剧了。这一发现表明经济原因导致了性别失衡。

如今中国的很多问题都可以通过类似的方式来回答。例如中国当前债务违约问题比较严峻,健全法治制度是否能帮助解决?追溯到2007年前后,为了解决钢铁煤炭产能过剩、部分地区经济下行违约破产增多的问题,中国在部分地区实行了破产法庭试点,并在此后推广至多个城市。最近美国西北大学的查克伯·庞提切利(Jacopo Ponticelli)与中国清华大学的李波教授运用该事例,他们比较破产法庭试点地区与非试点地区的差别,发现引入破产法庭之后,地区破产案件执法效率大幅提高,时间大幅缩短。并且,由于破产程序效率的提高,破产对企业构成了更强的事后约束,借款人更敢于借钱给民营企业,降低民营企业融资成本。再者,破产效率提升使僵尸企业数量有所下降。

循因果之道,启智慧之旅1
大卫·卡德。图/法新
循因果之道,启智慧之旅2
吉多·因本斯。图/法新

上述几项研究都是通过比较两类群体受某一外部政策冲击(自然实验)的影响差异,来研究这项冲击的影响。除此之外还有其他使用自然实验的方法,例如,劳动经济学里最重要的问题之一是研究教育对收入的影响。这个问题看似简单,却不易回答。笔者任教于复旦大学,如果我们看到复旦毕业生相对于一般学校毕业生收入更高,是否可以认为高收入来自高质量的复旦教育?答案不尽然,因为一些考进复旦的学生可能本来更聪明,我们看到的复旦毕业生的高收入,可能其实来自这些与复旦无关的个人特质。由安格里斯特等学者运用推广的“断点回归法”则很巧妙地回答了这类问题。举例来说,假如我们拥有所有人的高考分数数据库,当年复旦录取分数线是600分,那么我们选取600分上下的,如600-605区间内的学生(处理组)和595-599区间内的考生(控制组)做对比研究,前者刚刚好考入复旦,后者则因几分之憾没有考进。由于分数十分接近,平均意义上这两组人在其他维度上没什么差别,是否进入复旦基本上是运气使然。那么,比较两组人之后的收入差距(或者其他有意思的变量),得到的就是纯粹的复旦教育对收入或者其他方面的因果性影响。

还有一种十分重要的经典方法叫工具变量法,依然举例说明。收入怎么影响储蓄,这个问题其实不好研究,因为储蓄对收入很可能存在反向因果关系,即收入会影响储蓄,但储蓄反过来也会影响收入,好比“鸡生蛋、蛋生鸡”的关系。1989年诺奖得主特里夫·哈维默(Trygve Haavelmo)提出了工具变量的思想,这一思想是说,我们想研究x因素对y因素的影响,可以先找一个z,z只影响x,不直接影响y,那么z就是x的一个工具变量。通过z造成x的变化,进而研究引起的y的变化,这就构成一个因果链条。在上面的例子里,经济学家发现,可以用降雨量作为一些地区农民收入的工具变量。因为在很多地方农民是靠天吃饭的,干旱会导致农作物减产和收入下降,而天气相对于农业生产活动是外生变量,不会直接对储蓄行为产生影响。因此用天气变化引起的收入变化,可以得到收入对储蓄的因果影响。安格里斯特和因本斯将这一思想进一步正式化,给出了工具变量方法的一般框架(即LATE)。

借助自然实验的方法,经济学家可以在使用观测数据的情况下,回答很多重要的问题。从这个意义上说,整个世界就是经济学家的实验室,经济学的研究范围大大拓展了。

因果识别之“力”:见微可知著

什么因素造成了国家间的贫富差异?有的人说地理位置决定经济发展,如法国思想家孟德斯鸠。这种观点带有“宿命”的意味,位于热带的国家是否因为天气热、疾病多就不容易发展了?国家越靠近赤道越落后,这个是因果关系吗?第二种观点认为文化重要,如马克斯·韦伯,认为宗教影响到经济发展,新教伦理的国家经济发展比较快,天主教国家差一些,其他的更差;也有人说儒家思想很重要,中国、东亚四小龙的经验则是证据。还有一种观点认为,制度决定了经济发展,例如保护产权、法治等因素。众说纷纭,如何检验呢?

MIT的阿西莫格鲁(Acemoglu)教授跟他的同事约翰逊(Johnson)、罗宾逊(Robinson)用工具变量法给出了一种解释。他们用历史上殖民地的死亡率做制度的工具变量。背后的道理在于,非洲有些地区历史上因为疟疾、自然条件恶劣等因素,不适合居住,殖民者不愿意在此长期定居,而是建立掠夺性的殖民政府,把石油、金属等资源运回欧洲去。在生存环境比较好的地区,殖民者更愿意长治久安,因而也带去了欧洲的制度。作者用死亡率作为制度的工具变量,进而再研究制度对经济发展的长期影响,这样就得到了因果关系。他们发现,制度是影响经济发展的重要因素。历史不能假设,但是他们的研究告诉我们,在“逝者如斯夫”的历史长河中,也可以通过自然实验的方法打开历史的“黑匣子”,重构历史的反事实,找到其中的因果规律。

上一篇 点击页面呼出菜单 下一篇