中国财政发展协同创新中心微观计量工作坊第四讲在沙河校区骋望楼一楼圆桌会议室举行,中心2016级和2017级研究生全部参加。此次工作坊主要讲解的主要内容是微观计量中常用的匹配(matching)。在讲解的过程中,各级同学们认真听讲并积极提问,17级的研究生就匹配的相关知识展开了热烈的讨论,16级的研究生也进行了精彩的补充讲解。
本期主讲人为中国财政发展协同创新中心2017级研究生张一弢和宋子云。
(一) 匹配的概念和基本逻辑
在一般的实证研究中,由于存在很多其他变量混淆自变量和因变量之间的关系,研究者很难直接评估某一政策或冲击对于研究者所感兴趣变量的影响程度的“净效果”(net effects)。匹配在剥离各种混杂因素后,为评估真实效果提供了理论上的可行性。
匹配的核心正在于构造一个不可观测的反事实样本,在保证两个样本之间除了在是否接受处置之外存在差异外,其他方面都不存在差异或这种差异较小。
而另一个样本可能很难甚至不可能得到,为了解决这个问题需要引入反事实框架(a counterfactualframework)。“反事实推断模型”假定任何因果分析的研究对象都有两种条件下的结果:观测到的和未被观测到的结果。如果我们说“a是导致b的原因”,用的就是一种“事实陈述法”。而“反事实”的推断法则是:如果没有a,那么b的结果将怎样(此时,其实a已经发生了)?因此,对于处在干预状态(treatment condition)的成员而言,反事实就是处在控制状态(condition of control)下的潜在结果(potentialoutcome);相反,对于处在控制状态的成员而言,反事实就是处在干预状态下的潜在结果。显然,这些潜在结果是我们无法观测到的,也就是说,它们是缺失的。
为了更好地理解匹配的基本逻辑和思想,我们可以通过一个简单的例子来进一步说明:小明成功考取研究生,我们想评价其研究生毕业后就业情况:例如是否读研对于就业机会增加的程度。但是毕竟时间不能倒流,已经发生的事情无法回到以前的状况,我们无法观测到小明如果不读研时,所面临的就业机会是如何的,那么我们利用匹配研究这个问题呢?首先我们可以想象,如果在另一个平行时空里有另一个小明,两人除了在是否读研之外,其它各方面和现实观测到的小明一模一样,我们将另一个平行时空里的小明定义为小明二号。那么小明二号和小明在研究生毕业时的就业机会差别就是是否读研对于就业机会影响。
此时我们再引入一个匹配中的重点概念:倾向得分(propensity score):指在可观测到的混淆变量(confounding variables)被控制的情况下,被研究的个体受到某种自变量影响的条件概率。在一般的实证研究中,由于存在很多其他变量混淆自变量和因变量之间的关系,研究者很难直接探索二者之间的“净效果”(net effects)。以教育回报为例,大学教育的收入回报可能受到年龄、性别以及地区等等差异这些混淆变量影响。因此,上大学的人的平均收入与没有上大学的人的平均收入的差异有可能也反映了混淆变量的作用。这些混淆变量的影响通常被称为选择性误差(ion bias)。rosenbaum和rubin用数理方法证明:通过将这些混淆变量纳入logistic回归模型来产生一个预测个体受到自变量影响的概率(倾向得分),研究者可以通过控制倾向得分来遏制选择性误差对研究结论的影响从而保证因果结论的可靠性。
再回到我们的案例中,小明有收入y1,小明二号有收入y0,我们想知道的是小明(y1-y0),即小明考研的因果效应。小明考上研,可以观测到y1,但看不到y0;小明没考上研,可以观测到y0,但看不到y1。于是要计算(y1-y0)就存在数据缺失(missingdata)问题。如果扩展到所有人的考研就业问题,对于任意个体i,其未来收入yi可能有两种状态,取决于是否参加此项目,即:
其中,y0i表示个体i未参加项目的就业后的收入,而y1i表示个体i参加项目的未来收入,(y1i-y0i)即个体i参加该项目的因果效应。在经济学中,我们常常希望评估某项目或政策实施后的效应,如政策推出的各种项目,此类研究被称之为项目效应评估,也被称之为处理效应,项目参与者的全体构成控制组或对照组,而未参加项目者则构成控制组或对照组,即y1i-y0i。
由于无法同时观测到y0i和y1i,产生了一种“数据缺失”的问题:
直接比较参与者和为参与者(考研的和没考研的)就业机会就会有偏差:
而匹配的基本逻辑是将受到自变量影响的个体与没有受到影响的个体进行配对。而倾向得分匹配就是保证匹配起来的个体的倾向得分相等或者近似。再次回到小明读研后工作机会的例子,倾向得分匹配就是将没有考上研的人和考上研的人配对并保证他们的倾向得分(即上考研的概率)相同或近似,这样我们就得到了考上研和没有考上研的两组个体。因为已有的混淆变量已经在基于倾向得分的配对过程中被控制起来了,两组个体收入上的差异就只能归因于考研成功与否,而不是其他混淆变量,由此遏制了选择性误差。
(二)结合论文实例对匹配方法的再理解
如上所述,经济学中往往希望得到某一个政策或项目实施后的效应,称之为“处理效应”。参与该项目或政策的整体称之为“处理组(treatment group)”(后简称“tg”),未参与该项目或政策的整体称之为“控制组(control group)”(后简称“cg”)。如果直接将处理组和控制组的结果作差,得到的并非真正的处理效应。因为处理组和控制组在控制变量x上有差异,那么结果y的差异不能归因于政策或者项目的实施。按照第一部分的解释,需要构建一个“反事实框架”来得到处理效应,方法是只比较两组中相同(或相似)值的对象。
我们以angrist(1998)研究志愿服兵役对随后收入影响的论文为例,细致说明匹配的思想。这里di定义表示个i体是否参军,di=1表示参军,di=0表示不参军,y1i和y2i分别表示潜在的收入水平。文章希望得到处理组的平均处理效应,即志愿服兵役士兵的收入水平与假设其没有服兵役时的收入水平之差,但事实上已经服兵役的士兵假设未服兵役的收入水平是无法观测的,由此会带来选择性偏差。
但是按照条件独立假设,选择性偏差会消失,因为该假设意味着在给定的条件下,是否服兵役与潜在收入无关。
angrist(1998)运用匹配的方法纠正了选择性偏差后发现,退伍士兵的就业率明显高于同龄人。对于非白人青年来说,参军在长期来看只带来微弱的收入增加。而对于白人青年,参军反而会使他们的长期收入降低。
综上所述,匹配法对由每个控制变量的特定值所决定的个体计算处理组和控制组之间的平均差异,然后用加权平均的方法将这些平均因果效果汇总到一个总的指标中。匹配实际上是将将效果加权平均到一个总体平均处理效果。在运用匹配方法进行加权平均时,所使用的权重是处理组中协变量的分布函数,匹配法将最大权重给予最可能被称为处理组的那个组别。
本讲主要是对微观计量中匹配法理论知识的探究,下一讲将会进入倾向得分匹配方法的理论和实际操作讲解。11月29日(周三)微观计量工作坊第五讲将在沙河校区图书馆一层继续进行,主要内容为倾向得分匹配法,讲解会结合倾向得分匹配方法的理论和stata实际操作进行,有助于同学们深入了解和掌握微观计量经济学的原理和实操,应用到评估政策实际效果的实践中,为大家今后经济学研究的应用奠定知识和技术基础。
作者信息:
中国财政发展协同创新中心17级硕士研究生 宋子云
邮箱:firefly_szy@163.com
中国财政发展协同创新中心17级硕士研究生 张一弢
邮箱:1139314084@qq.com
编辑:张鹏远
责编:姚广
中央财经大学 中国财政发展协同创新中心 版权所有 copy right © 2017-2020
邮编:100081
地址:北京市昌平区沙河高教园区
联系电话:010-61776239