经济观察

您当前的位置:首页 > 经济观察 > 其他专题
Imbens & Rubin:因果分析的基本框架
发布时间:2015-09-18 16:57:36

在应用统计中,人们感兴趣的问题不仅仅是描述性统计和相关关系,还包括因果关系。为了构建因果分析的框架,我们首先需要引入一些基础性的概念:潜在结果(potential outcomes)、个体处理稳定性假设(the stable unit treatment value assumption, SUTVA)、分配机制 (assignment mechanism)

因果关系的分析一定要有行动施加于个体。给定个体和一个行动集,我们给每个行动和个体的搭配赋予一个变量,这个变量叫做潜在结果。事后来看,只有一种潜在结果可以被观察到。树林里分开两条路,我走大路或者小路,两条路的尽头都是我的潜在结果,但是如果我走了大路,那么我只能在大路的尽头畅想如果走了小路会有什么结局,但也只能是畅想,事实如何,没人知道。一种行动或者处理的因果效应可以通过比较潜在结果得到。举个例子,我头疼,可以吃阿斯匹林或者不吃阿斯匹林,只需比较我吃阿斯匹林和不吃阿斯匹林时头疼的程度,就能知道阿斯匹林对我头疼症的因果效应。问题是,吃阿斯匹林与不吃阿斯匹林的结果不能同时被观察到。

关于因果效应的定义有两点需要注意的地方。首先,这一定义依赖于潜在结果,但是不依赖于哪一个潜在结果最终实现,无论我有没有吃阿斯匹林,阿斯匹林对我头疼症的因果效应都应该是一样的。其次,因果效应来自于对事后同一时间同一个体潜在结果的比较。特别地,对同一个体事前事后的比较并不满足因果效应的定义。

与因果效应的定义不同,因果效应的估计必须依赖能够被观察到的潜在结果。定义因果效应,只需一个个体就够了,而由于一个个体只能带来一个可被观察到的结果,所以因果效应的估计需要多个个体,而且这些个体被施加的行动需要有所不同(不能所有人都吃阿斯匹林,或者所有人都不吃阿斯匹林)。要估计因果效应,我们还需要知道(或者假设)为什么是一些潜在结果实现而非其他的潜在结果。也就是说,我们需要知道或者假设,行动在个体之间的分配机制是什么。对分配机制的介绍放到最后,我们先来看个体处理稳定性假设。

个体处理稳定性假设(SUTVA)是指任意一个个体的潜在结果不随其他个体是否接受处理而改变,而且每个个体受到的处理和潜在结果之间是定义良好的函数。

SUTVA包括两个部分。第一个部分是说,不同个体间的潜在结果是相互独立的,我的头疼症只应该与我自己吃不吃阿斯匹林有关,别人吃不吃阿斯匹林不应该对我的头疼症产生任何影响。这当然只是一个假设,如果头疼可以传染,即使我吃了阿斯匹林,如果我室友不吃并一直头疼,那么室友的头疼是会传染给我的。假设阿斯匹林是有效的,在室友不吃药的情况下,我吃药与否的潜在结果都是继续头疼;而如果室友吃药的话,我吃药就不头疼,不吃药就会继续头疼。这时,SUTVA的第一部分就并未得到满足。

上面这个吃药不吃药的例子听起来有点人造,所以考虑一个更容易被接受的例子。你考虑参加一个大型职业培训项目,但是如果参加这个项目的人足够多,那么你接受培训后在收入上获得的好处可能会被更加激烈的竞争所抵消,这在经济学上被称为一般均衡效应。当存在个体之间的相互影响时,为了使SUTVA更加可信,我们可以赋予个体一个更宽泛的定义,比如研究教育问题时经常以学校为单位而非学生。SUTVA的第二部分是指,不同强度的处理都应该被清楚明白地表现出来。还是阿斯匹林的例子,如果我们把处理划为服用阿斯匹林和不服用阿斯匹林,那么这里的服用阿斯匹林就应该是指服用相同规格和药性的阿斯匹林,不能存在不同药性的阿斯匹林。如果有两种强度的阿斯匹林,那么对于处理的划分就应该改为服用强阿斯匹林、服用弱阿斯匹林和不服用阿斯匹林。

前面已经讲过,潜在结果不能全都被观察到,这是进行因果分析所面临的最根本的问题。 Rubin(1974)认为这一问题实质上就是一个缺失数据的问题。因此要进行因果分析,就需要把缺失的潜在结果填补上。一些个体的背景特征(协变量)往往能够帮助我们进行缺失潜在结果的预测。

不是所有变量都可以作为协变量,协变量必须满足一个条件:个体是否得到处理被先验地认为不会对协变量造成影响。个体永久性的特征,或者发生在处理之前的变量,都可以作为协变量,它们也被称为处理前变量。协变量的有用性体现在三个方面:使估计更加精确,提供特定族群的因果分析,非混淆性(unconfounded)。其中最重要的就是非混淆性,非混淆性是指分配机制不依赖于潜在结果。能力比较低的工人更可能接受职业培训,而能力比较低的工人工资也相应地较低,因此工资这一潜在结果与接受职业培训与否相关,这样就不满足非混淆性。直接比较参加培训工人的平均工资和不参加培训工人的平均工资就会低估培训的效果,但是如果比较各个方面特征比较相似的工人(比如性别一样,学历一样,经验一样)中参加培训工人的平均工资和不参加培训工人的平均工资,我们会更加愿意相信这两部分工人之间的工资差距来自于职业培训。

分配机制是决定哪些个体得到处理,从而哪些潜在结果可以被观察到的过程。正式地来说,分配机制是协变量、潜在结果和分配向量的函数,表示在特定协变量和潜在结果下,某一分配向量实现的概率。什么是分配向量呢?假设有两个人,分配向量就是表示两人是否得到处理的二元数对,如(培训,培训)、(培训,不培训)、(不培训,培训)、(不培训,不培训)。

对于分配机制有三个基本限制:

个体独立性(individualistic assignment):任意个体得到处理的概率不依赖于其他个体的协变量与潜在结果。

概率规范性(probabilistic assignment):个体得到处理的概率严格大于0,小于1

非混淆性(unconfounded assignment):分配机制独立于潜在结果。

根据Cochran(1965),书中对试验和观测性研究进行了区分。对于试验,研究者完全了解并可以控制分配机制。对于观测性研究,研究者或者并不知道分配机制是怎样,或者无法对分配机制进行控制。

书中讨论了三种分配机制。第一种是随机试验(classical randomized experiments),随机试验的分配机制满足上面提到的三个限制,而且研究者对于分配机制完全了解并可以进行控制。第二种是正规分配机制(regular assignment mechanism),它依然满足三个限制,但是研究者对于分配机制并不了解或者没有控制能力。第三种分配机制本身也是正规的,但是个体被分配到的处理和个体实际接受的处理是不同的,这来自于个体实现效用最大化的主观能动性。此时,我们需要工具变量的方法。

本书接下来的部分分别在这三种分配机制下探讨因果关系的推断问题。

(本篇是邓欢关于Guido W. ImbensDonald B. Rubin二位大神的新书Causal Inference for Statistics, Social, and Biomedical Sciences: An Introduction的读书笔记,内容来自于书中的part I: Introduction。)

 

文章来源:微信公众号“文献自助餐”。

详见:http://mp.weixin.qq.com/s?__biz=MzIwODAxNDQzMw==&mid=616200014&idx=1&sn=7df70993ba12e33121bd45087af6028a&scene=2&srcid=8ATGSUbJuO9VN5APzoKE&from=timeline&isappinstalled=0#rd