学生风采

当前位置: 首页 >> 学生风采 >> 正文
【“微观计量工作坊”第7期-完结篇】工具变量法
2018年01月19日    编辑:    浏览量:    


中国财政发展协同创新中心“微观计量工作坊”第7期在中央财经大学沙河校区骋望楼一楼圆桌会议室如期举行。本次研讨会17级研究生李静、刘若熙担任主讲人。16级、17级财政基础理论团队研究生及其他学院同学也积极参与到现场的学习与讨论中。


本次研讨会主要围绕微观计量中重要的实证方法——“工具变量法”展开,对工具变量法的基本概念、估计方法、识别检验、实际应用等进行了学习与讨论。


(一)背景知识:内生性问题

考虑最简单的一元线性回归模型:

    1. 遗漏变量:如果遗漏的变量与其他解释变量不相关,一般不会造成问题。否则,就会造成解释变量与残差项相关,从而引起内生性问题。

    2. 解释变量与被解释变量相互影响。

    3. 度量误差 (measurement error):由于关键变量的度量上存在误差,使其与真实值之间存在偏差,这种偏差可能会成为回归误差(regression error)的一部分,从而导致内生性问题。

工资和受教育水平同时受到能力的影响,然而,即使我们可以通过其他相关的测试得出能力的代理变量,能力是不可直接观测的变量,这就带来了遗漏变量的内生性问题。又比如,在联立方程中,消费和收入同时受一些宏观因素的影响,这就带来了联立方程偏误。我们可以通过工具变量的方法来解决内生性的问题。

虽然内生变量是“坏”的变量(与扰动项相关),但仍可能有“好”的部分(与扰动项不相关的部分),正如坏人通常也有好的一面。如果能将内生变量  分解为内生部分与外生部分之和,则可能使用其外生部分得到一致估计。而要实现这种分离,通常需要借助另一变量——“工具变量”(instrumental variable,简记 iv),用z来表示,而工具变量的名字源于它起着工具性的作用。

(下图分别表示:外生性;内生性;工具变量)


(二)基本概念

    工具变量z:工具变量z与解释变量x相关,但与扰动项无关。即z能且只能通过解释变量x影响被解释变量y。基本假定包括:(1)相关性(2)外生性


(三)估计方法

假设找到内生变量 x的有效工具变量z ,则可将x对z进行ols 回归,从而分离出x的外生部分,此回归称为 “第一阶段回归”(first stage regression)。

记此回归的拟合值(fitted value)为

其相应的残差(residual)为

显然,第一阶段回归将内生变量x分解为两部分:

其中,第一阶段回归的拟合值为工具变量z的线性函数,故为外生部分(因为z外生);而其余的残差为内生部分。既然第一阶段回归的拟合值外生,故只要将拟合值替代原模型中的内生变量 ,即可用ols 得到一致估计:

称此回归为“第二阶段回归”(second stage regression)。

首先,由于为工具变量z的线性函数,故与扰动项无关。其次,根据 ols 的正交性(陈强,2015,p.62),ols 回归的拟合值与残差正交(orthogonal),故第一阶段回归的拟合值与第一阶段回归的残差不相关。因此,ols 为一致估计。由于此工具变量法通过两个 ols 回归来实现,故称为 “二阶段最小二乘法”(two stage leastsquares,简记 2sls)。


(四)识别问题

如果工具变量个数正好等于内生变量个数,则称为 “恰好识别(just identified 或 exactly identified)。如果工具变量个数少于内生变量个数,则无法进行 2sls 估计,称为 “不可识别”(unidentified),因为无法得到对模型参数的一致估计。如果工具变量个数大于内生变量个数,则称为“过度识别”(overidentified)。在恰好识别或过度识别的情况下,均可进行 2sls 估计;而在不可识别的情况下,则无法进行。


(五)检验方法

1.   内生性的检验

在实证论文写作中,内生性问题或多或少都会存在,因此内生性检验一般不会专门报告在论文结果中,但文章必须要解释如何处理内生性问题。

(1)  hausman test:通过对比ols和iv的结果是否存在显著的差异来判断,如果差别显著,则解释变量为内生,反之亦然。

(2)  durbin-wu-hausman test

2.   不可识别检验:检验秩条件是否成立。

   过度识别检验:sargan statistic

   弱工具变量检验:工具变量与内生变量的相关性较弱,导致估计不准确(cragg-donald f统计量)

3.   工具变量的相关性(instrument relevance)

如果工具变量与内生变量的相关性很弱,则通过工具变量分离出的内生变量之外生变动仅包含很少的信息。因此,利用这些少量信息进行的工具变量法估计就不准确,即使样本容量很大也很难收敛到真实的参数值。这种工具变量称为“弱工具变量”(weak instruments)。

下面通过蒙特卡洛模拟(monte carlosimulation)来直观地考察弱工具变量的后果。


从上图可知,在强工具变量的情况下,2sls 估计量以真实参数值 2 为中心,近似于对称的正态分布(上图虚线),故可使用其渐近正态分布进行大样本统计推断。

下面考察弱工具变量的情形, 从上图可知,尽管样本容量已为 10,000(堪称大样本),但 2sls 估计量依然有偏差(并未以真实参数 2 为中心),而且是左偏的非对称分布,与正态分布(上图虚线)有明显差别。因此,无法使用通常的渐近正态分布进行大样本统计推断。

检验弱工具变量的一个经验规则(rule ofthumb)就是第一阶段回归的 f 统计量应大于或等于10。如果发现存在弱工具变量,则可能的解决方法包括:

(1) 寻找更强的工具变量。

(2) 使用对弱工具变量更不敏感的 “有限信息最大似然估计法” (limited information maximum likelihood estimation,简记 liml)。在大样本下,liml 与2sls 渐近等价,但在弱工具变量的情况下,liml 的小样本性质一般优于 2sls。

(3) 如果有较多工具变量,可舍弃弱工具变量,因为多余的弱工具变量反而会降低第一阶段回归的 f 统计量。

经典案例:出生季度是否为弱工具变量?

劳动经济学的一个核心问题是研究教育投资的回报率,比如估计如下方程:

其中,被解释变量为工资对数(lnwage),关键解释变量为教育年限(educ),而向量 z 为其它控制变量(比如种族、婚否、是否住大城市、地域虚拟变量、出生年份虚拟变量、年龄、年龄平方等)。扰动项包括影响工资的其它因素,比如不可观测的个体能力,而个体能力可能与教育年限相关,导致 ols 不一致。为此,angrist and krueger (1991) 使用1960、1970与1980年已部分公开的美国人口普查数据(public use census data),并开创性地将出生季度(quarterof birth)作为教育年限的工具变量。

由于美国多数州的法律强制要求青少年在满16岁生日之前必须在校上学(compulsory schooling laws),而又要求儿童在入学那年的1月1日须满6周岁,这导致年初出生的儿童在入学时年龄比年末出生的儿童更大。因此,相比年末出生的学生,年初出生的学生在其受教育过程中,更早就达到了法定退学年龄(legal out age),这使得第1季度出生者所受教育平均而言低于第4季度出生者,参见下图。

因此,出生季度与教育年限相关,满足相关性;另一方面,出生季度不太可能通过其他渠道影响工资,故满足外生性。为此,以第4季度为参照系,可使用第1季度、第2季度与第3季度的出生季度虚拟变量作为工具变量。考虑到季度效应在不同年份可能不同(参见上图),angristand krueger (1991) 实际上使用 “出生年度虚拟变量”(year-of-birthdummies)与 “出生季度虚拟变量”(quarter-of-birth dummies)的交互项作为工具变量。(具体的实证过程可参见angrist and krueger (1991),作者给出了文章使用的数据集。)

4.   工具变量的排他性(exclusion restriction)

当模型中存在内生的解释变量时,寻找合适的工具变量是最为常用的方法。一个有效的工具变量必须满足两个条件。首先,工具变量必须和内生解释变量相关,这一点通常比较好满足。其次,工具变量必须满足排他性约束(exclusion restriction),即工具变量与其他可能影响被解释变量的扰动项不相关。排他性约束意味着,工具变量只能通过影响内生的解释变量进而影响我们关心的结果变量,而不能经由其他的渠道对结果变量产生影响。研究者们通常需要花费大量的时间和精力向读者证明,他们使用的工具变量能够满足排他性约束。

为了解决工具变量不能满足严格排他性约束的办法,conleyet al. (2012) 放松了工具变量的排他性约束,假定工具变量可以是近乎外生的(plausiblyexogenous)。

y=xβ+zγ+ε      (1)

 x=zп+v              (2)

在(1)式和(2)式中,y是结果变量, x是内生变量矩阵, z是工具变量矩阵。ε和v是扰动项。传统的模型要求z满足排他性约束,即γ=0。现在放松排他性约束,假定γ很接近于0,但是可以不必严格等于0。此时,利用先验信息对γ的取值或分布情况进行一定的设定,也能估计出我们感兴趣的参数β。当β和γ都是向量时,可以证明:

(3)

从(3)式可以看出,当γ较小时,仍然比较接近于真实值β。(3)式还可以反映出弱工具变量问题对估计结果造成的影响。当z和x的相关性很小,即п很小时,γ/п将变得很大,从而带来较大的估计误差。当z和x的相关性很强,即п很大时,估计结果较为准确。作者介绍了四种方法估计γ取值。第一种方法是列出γ的可能取值,然后分别进行估计。例如,假定γ=γ0,(1)式可以转化为

(4)

然后,对(4)式进行二阶段最小二乘估计(2sls)可以估计出。第二种方法是假定γ取多个值,并且这几个值出现的概率不同。例如,γ以0.1的可能性取0.02,以0.9的可能性取0.03。第三种方法是假设γ服从一定的概率分布,如正态分布、均匀分布等,然后在γ的不同取值上进行点估计。第四种方法叫做贝叶斯估计。前三种方法均假定γ的取值或分布和β无关,第四种方法允许γ的分布和β有关系。(详细的技术细节请参见原文)在理论部分之后,作者利用以往文献中的几个经典数据,采用上述四种方法进行了估计,并且进行了比较。


(六)拓展交流

在阅读参考书籍中,我们提出以下问题进行交流。

1.  半处理效应

假设我们观测职业培训计划对于再就业的影响是基于一定时间段的,比如在失业100内实现再就业。处理组(t group)表示实现再就业,控制组(c group)表示未实现再就业。如果还存在一组样本是中途退出培训计划的,我们称之为“辍学组”(d group)

       hsu(2006)研究了烟雾多种类型的吸烟者(不吸烟者、被动吸烟者、不吸入型吸烟者以及轻微吸烟者)呼吸功能的影响。被动吸烟的危害要小于轻度吸烟,尽管人们通常担心被动吸烟者缺乏过滤嘴的保护,受到的危害会更大。

而在实际计算过程中,一个控制组无法代表多个不同的含义。但是,以不吸烟的控制组为例,它可能包括着部分真正不吸烟的人,也可能包括一群过去经常吸烟,之后出于健康考虑而停止吸烟的人。在职业培训的处理组中,它培训的人员可能是从未申请过工作的,也可能是有过申请经历而被拒绝的人员。我们可以看出,从不吸烟的人群与后期戒烟的人群是存在差异的,同样,没有申请经历的人群与申请被拒人群之间也存在明显差异。那么,在职业培训的案例中实际上存在着两个控制组,也就是没有申请经历的与申请被拒两组,尽管这两个控制组都没有被处理,但是它们之间仍然存在着造成最终差异的多个不可观测因素。

对于这一问题,可以通过设置多个控制组来分析这些不可观测的混杂变量。以职业培训为例,我们以表示没有申请经历人群,以表示有申请而被拒的人群,同时假定有,使得除了在条件下均存在系统性差异,这种差异就来源于不可观测变量。那么培训项目的管理者就可能挤出部分具有较高不可观测变量值的申请者,比如个人能力较高的人群以保证项目的成功。相应的,控制组中覆盖的人群对应的不可观测值较低,那么在与组对比的过程中,控制组可以帮助我们分析不可观测变量。

2.工具变量的来源

在现实生活中,有效的工具变量的确定是有一定难度的。而实际上工具变量估计的一个主要问题不是在于如何处理工具变量,而是如何找到一个合适的工具变量。接下来,我们来分析工具变量的来源在哪里。

首先,工具变量需要满足两个条件,一个是工具变量必须外生,也就是cov (zi, εi) = 0,第二是工具变量必须与内生变量x相关,cov(zi, xi) 0。这里出现的一个问题是cov (zi, εi) = 0要求zi与不可观测的误差项无关,但是这一条件难以进行验证,需要借助于经济理论和常识分析。同时,当zi与不可观测的误差项无关,zi与x呈正相关或负相关时,iv是一致的,但当zi与x只是弱相关时可能产生较大的误差,此时zi为弱工具变量。因此,如何找到一个有效的工具变量成为我们进一步需要研究的问题。

angrist (1990)通过研究越南战争中军队的经历(d)对个人参加越战之后终身收入(y)的影响,这个例子中存在一个明显的自我选择问题,也就是:也许人们因为能从军队中得到最多的收入而选择参军,或者参军的选择与其他对收入有影响的特征相关。但是,由于国防部征兵的时候会给适龄的男生一个号码draft lottery,然后定一个上限,如果号码小于这个上限,那么这个人在征兵的范围之内,于是他定义征兵号是否小于这个上限为draft eligibility,显然draft eligibility为1的人更可能参加越战,但这个数字是随机抽取的,所以可以把drafteligibility看作一个合适的工具变量。实际上,政府政策经常可以被看成一个工具变量,因为政府政策往往是和个人因素不直接相关的。但是它的政策效应却会对个人产生影响。这时就有另外一个问题,也就是政府办事情是否可靠?就越战征兵的案例来说,美国政府第一次抽奖时,没有把彩球摇匀,因此后半年的中奖率显著高于前半年。另一方面美国政府规定如果在大学里读书可以免征兵役,因此父母更倾向于把孩子送到大学读书,此时,heckman (1996)提出这时潜在的雇佣者可能不太会雇佣那些更加可能被选中的人群,也就不满足排他性约束假设,因此z可以直接进入到y的等式中:

yi =β1 +β2di +β3zi +ui

在这个例子中,仅从随机性的角度难以提供一个有效的工具变量,由于z和d一起进入了y等式,那么我们就需要一个新的工具来说明d,另一个问题在于当d中包含了多个含义时,把包含d和d的函数加入到y函数式中有:

yi = β1 + β2di + β3d2i + ui

此时我们需要两个工具,单一的随机二元变量是不全面的。

在随机性实验中,有一些准实验(natural experiment)中没有特别考虑的随机分布,但是准实验中确实存在一定的随机性。所以寻找一个工具变量也就是找一个与d相关的外生变量,比如在分析学生数量(d)对于女性劳动力供给(y)的关系案例中,学生数量相当于影响y的一个内生变量,因为d和y之间是相互影响的,那么要找一个d的外生变量,这里选择的就是双胞胎出生的数量作为一种会带来d增长的具有外生性的工具变量,因为一个人可以自行确定是否生小孩,但是无法决定是否生养双胞胎。rosenzweig and wolpin (1980) 提出仅考虑第一次怀孕中生双胞胎的样本,因为如果考虑非一胎中生双胞胎的样本,女性生小孩的数量可能在数据中被过多的体现,进而生成一种内生性问题,因为是否选择生二胎继续生育是由个人进行选择的。同时,在双胞胎生育之后的第一年劳动参与率会降低,但是之后的年份又会重新增加,因此需要考虑因为双胞胎出生带来的儿童数量增加,形成的外生的且暂时的消极影响。





至此“微观计量工作坊”的全部7期内容已经推送完毕,非常感谢大家的关注!在以后的推送中小编会把往期的内容汇总,希望大家继续关注我们!



作者信息: 

中国财政发展协同创新中心17级硕士研究生 李静 leejinglove17@163.com

中国财政发展协同创新中心17级硕士研究生 刘若熙 monacoliu@163.com

 

编辑:张鹏远

责编:姚广