【财税文摘第7期】利用倾向得分匹配估计反贫困计划的效果-中国财政发展协同创新中心

学生风采

当前位置: 首页 >> 学生风采 >> 正文

学生风采

【财税文摘第7期】利用倾向得分匹配估计反贫困计划的效果

2017年09月05日浏览量：

背景

1990年代中期，阿根廷的失业率急剧上升，于1996和1997年达到18％。这对穷人的打击是巨大的。例如在1996年5月，根据布宜诺斯都市区的的永久性住户调查（EPH）结果，布宜诺斯都市区中人均家庭收入中最贫穷的十分位数的失业率为39％。随着人均收入的增加，失业率逐渐下降。

为应对这一宏观经济危机，在世界银行的财政和技术支持下，阿根廷政府于1997年五月推出了TrabajarⅡ计划，该计划采用两种方式：一是通过以较低的工资提供短期工作，以帮助失业工人；二是该计划试图在贫困地区找到以帮助维护和开发当地的基础设施的项目。本文仅针对第一个目标评估进展情况。

反贫困计划由政府组织，目的是缓解如由于宏观经济或农业气候的冲击导致大量贫困人口失业的危机。反贫困方案通常要求参与者必须努力才能获得福利，主要目的是提高受危机影响的贫困家庭的现有收入。

实证方法和数据

论文采用倾向得分匹配（PSM）方法估算阿根廷反贫困计划对参与者的收入增益。匹配方法已经在评估中得到广泛的应用，但是基于倾向得分匹配的经济应用仍然较少。

论文使用两次住户调查。一个是计划参与者的调查，另一个是国家抽样调查，用于获取比较组。这两项调查均由政府统计局，国家统计局（INDEC）进行，使用相同的调查问卷，相同的面试小组，大约在同一时间。第一个数据集是对Trabajar参与者进行评估的特殊目的样本。样本设计涉及到许多限制。最后我们使用的活跃参与者总数是2,802。第二个国家调查是德黑兰社会（EDS）在1997年中期进行的大规模的社会经济调查。 EDS样本涵盖居住在五千以上居民地区的人口。阿根廷的这些地区共有420个，占城市人口的96％，占总人口的84％。抽取114个地方。

如果仅当两个样本中的X的值相同时才声明匹配，这是不切实际的，因为X的维度可能非常高。而倾向得分匹配可以解决这一问题，它能够将潜在的高维匹配问题降低到一维问题。如公式（1）所示，将倾向得分非常接近（绝对值相差小于ε）的样本进行匹配。

（1）

该反贫困计划对人均收入的平均提高效应G可以用公式（2）表示。Yj1是参与者j干预后的收入，Yij0是j的匹配非参与者的收入，P是参与者的总人数，NP是非参与者的总人数，W是权重。

（2）

为了解决公式（2）中权重的衡量问题，论文使用三个不同的权重，从而报告三种不同的匹配估计。一是“最近邻”估计，我们找到每个参与者最接近的非参与者匹配。估计值是参与者与其匹配的非参与者之间的收入差异的简单平均值（如果参与者的收入低于匹配的非参与者的收入，将影响视为零而不是负数）。二是最接近的五个匹配，顾名思义，即使用最接近每个参与者的五个非参与者进行匹配。三是使用Heckman等人（1998）提出的一个核加权估计（非参数匹配）。公式（3）、（4）展示了其权重估计方法，aN0是带宽系数，K（·）是衡量参与者和被参与者差别的函数。由于参数的标准差和自举的标准差结果几乎相同，论文报告参数的标准差的结果。

（3）

（4）

实证分析结果

在参与组和非参与组的描述性统计结果中，参与组和非参与组在各个经济变量上都具有较大差异。如参与组的人均收入为73，非参与组的人均收入为366；参与组的人均家庭人数为4.9人，非参与组的人均家庭人数为3.4人；参与组58%的家庭收入低于非参与组10%的家庭收入分位数，参与组60%的个人收入低于非参与组10%的个人收入分位数。

下图给出了参与者和非参与者的估计倾向得分的直方图。匹配前，参与者样本的倾向得分直方图分布较为均匀，而非参与者中超过75%的人仅有0-10%的概率参加该计划。匹配后，从国家样本获取的最近邻居的比较组的平均得分为0.394，非常接近Trabajar样本的平均得分0.405。

下图报告了三种匹配方法的倾向得分匹配估计结果。第二列报告了最近邻匹配的估计结果，第三列报告了最近五个匹配的估计结果，第四列报告了非参数匹配的结果。全样本的估计结果显示，当我们从最近邻移动到非参数估计时，估计的精度有所增加即标准差有所下降。但是，虽然采用非参数估计匹配和采用最近五个匹配相比，估计精度有所提高，然而与匹配次数的增加相比，改进只是适度的。由于这个原因，本文的其余部分是基于“最近五个”匹配的估计。

下图显示，随着处理前收入的升高，该反贫困计划提高收入的效应呈现逐渐减弱的趋势，最终稳定在75左右。

最后四张图报告了基于“最近五个”匹配的估计结果。第一张图展示的是全部样本的估计结果。该工作计划对家庭收入的提高为102.6，提高率为25.9%。按分位数的估计结果显示，42%的参与者在全国最贫穷的十分之一区间内，52%的参与者家庭在全国最贫穷的十分之一区间内。

第二张图展示的是女性样本的估计结果。对家庭收入的净提高作用和全样本几乎相同（103.9），但按分位数的估计结果与全样本有较大差异，28%的参与者在全国最贫穷的十分之一区间内，38%的参与者家庭在全国最贫穷的十分之一区间内，女性的分配相比男性不太有利于穷人。这可能反映了妇女在其他工作中的工资较低，使得该工作计划对非贫困人口的吸引力也很大。

第三张图展示的年龄较小的样本的估计结果。该工作计划的净收益相比全样本和女性样本明显提高（125.2），这可能反映出他们在劳动力市场上缺乏经验。

第四张图展示的成熟劳动力的样本的估计结果。虽然工作计划对收入的提高效应相对不明显（85.8），但是由于几乎60％的参与家庭来自最贫穷的十分位数，对于穷人更为有利。

因此，推动年轻人的更多参与需要平均收益和更好的分配之间的短期权衡，也可能需要通过减少学业，与年轻人的未来收入进行长期的权衡。

结论

1.该工作计划对参与者家庭收入的提高为102.6，52%的参与者家庭在全国最贫穷的十分之一区间内。

2.女性样本的分配相比男性不太有利于穷人。

3.该工作计划对年轻人的收入提高更明显。

4.该工作计划对成熟劳动力的收入提高分配更合理，更有利于穷人。

Abstract：We apply recent advances in propensity-score matching (PSM) to the problem of estimating the distribution of net income gains from an Argentinean workfare program. PSM has a number of attractive features in this context, including the need to allow for heterogeneous impacts, while optimally weighting observed characteristics when forming a comparison group. The average direct gain to the participant is found to be about half the gross wage. Over half of the beneficiaries are in the poorest decile nationally, and 80% are in the poorest quintile. Our PSM estimator is reasonably robust to a number of changes in methodology.

翻译整理：杜浩鹏

原文信息：Journal of Business & Economic Statistics, Vol. 21, No. 1 (Jan., 2003), pp. 19-30 Published by: American Statistical Association