Heckman等人首先提出用DID方法来评价社会公共政策的实施效果,随后DID方法的研究和应用成果层出不穷。典型的有:Card等研究了移民政策和最低工资制度对工资和就业的影响;普哈尼评估了1991年波兰实施的失业救济政策改革对失业持续时间的影响。斯图尔特评估了1999年至2001年间英国实行的最低工资制度对就业的影响。

多诺休等人发现美国和加拿大的谋杀率具有相同的变化趋势,因此以废除死刑的加拿大为对照组,评估了美国恢复死刑制度对降低谋杀率的影响。结果表明,美国实行的死刑政策并没有遏制社会上的谋杀率。陈等利用中国2000个家庭的数据来评价世界银行发展项目的效果。近年来,国内学者开始使用DID方法来评价政策效果。主要研究内容如下:李周安等评价了农村税费改革对农民收入增长的影响;朱宁宁等评价了中国建筑节能政策的实际效果;黄晴对2002-2005年电力行业放松管制的政策效应进行了实证检验和研究。刘圣龙等评价了西部开发在中国西部经济增长和区域经济趋同中的作用。聂、等利用国家级企业数据,许萱等利用上市公司数据研究2004年以来东北地区实施增值税转型政策的影响。于洪海等基于上市公司数据对股权分置改革的有效性进行了实证分析;李楠等人利用中国的工业数据对国有企业改革的绩效进行了评价。

DID方法允许不可观测因素的存在,允许不可观测因素对是否接受干预的决策产生影响,从而放宽了政策评估的条件,使政策评估的应用更接近经济现实,因此被广泛使用。但是,研究者也要充分认识到DID方法在应用中的局限性:

数据要求更严格。DID方法基于面板数据模型,不仅需要横截面单位的数据,还需要研究个别时间序列数据,尤其是政策实施前的数据。因此,DID方法比Matching需要更多的数据。

个体时间点效应μ它不受控制。DID需要一个很强的认知假设,要求在政策不执行时,实验组和对照组的结果变量随时间变化的路径是平行的。这个假设没有考虑个体时间效应μit的影响。由于μit的影响,项目实施前后,实验组和对照组个体行为的结果变量并不平行,应用传统DID方法会产生系统误差。

不考虑个体所处环境对个体的不同影响。DID方法假设环境因素的影响对同一环境中的个体具有相同的影响,即θt对所有个体都是相同的。但是在实践中,实验组和对照组的个体在面对相同环境因素的影响时,由于受到一些不可观测因素的影响,可能会有不同的反应,进而在DID的应用中会出现问题。

针对上述问题,国外学者在使用的过程中逐渐扩展了DID。扩展的方向主要有两个:一是考虑DID中不受控制的因素,进一步放宽其适用条件;二是结合DID和Matching等政策评估方法,提出新的估计。例如,贝尔等人考虑了个人环境对个人的不同影响,提出了趋势调整估计量;Heckman等人提出了一种新的条件DID估计量,将Matching和DID方法相结合,不仅可以大大减少选择偏差,而且使结果更加可信。然而,不应忽视的是,条带DID仍然必须满足“共享相同支持域”的假设。

4.趋势匹配法

匹配是一种非实验性的方法,是对一些不使用或不便于用实验方法区分实验组和对照组的数据的近似实验方法。通过匹配法假设和控制协变量后,具有相同特征的个体对政策的反应是相同的。换句话说,不可观察因素不影响个人是否接受政策干预的决定,选择只发生在可观察变量上。因此,对于每个实验组个体来说,根据可观察到的特征选择一个控制组个体是一个反事实。

在实证分析中,在选择对照组时,根据匹配方法的不同,匹配可以分为协变匹配和倾向得分匹配。其中,CVM涉及很多协变量,会导致“维数灾难”,计算过于复杂。Rosenbuam等人指出,如果协变量可以使条件独立假设成立,那么作为协变量函数的倾向得分一定可以使CIA成立。通过将协变量中包含的信息传递给PS,PSM可以克服CVM的缺点,取得成绩,降低维数,因此可以在实践中得到更多的应用。

Rusenbaum等人提出了利用PSM消除混合因素造成的偏差的思想,这一思想在一开始并没有受到太多的重视,但近年来在医学、经济、政策评估等领域得到了广泛的应用,成为政策效果评估中最常用的方法。珀金斯等人讨论了该方法在流行病学药效学中的应用,吉利根等人评估了在埃塞俄比亚农村实施的紧急食品救援政策的效果,桑德拉等人评估了法国再就业培训计划的效果。近年来,国内学者开始使用PSM方法来评价社会公共政策的效果。陈宇萍等人利用PSM方法研究了滇西南山区采用旱稻改良技术对农民收入的影响,解决了用传统方法分析农业技术效果时农民自主选择技术带来的因果干扰问题;李佳璐利用S省30个国家级重点发展县2009年的农村贫困监测数据,运用PSM方法对扶贫项目的扶贫效果进行了评价。

PSM作为一种非参数方法,不需要假装可观测因子的条件均值函数和不可观测因子的概率分布,因此它比参数方法具有优势。然而,PSM也有局限性,主要如下:

①有力的前提。PSM的应用必须满足CIA和公共支持域假设,称为“强可忽略”假设。一旦违背了这个假设,ATE和ATT就会有失偏颇。Heckman等人通过假设检验表明,当“可忽略性强”的假设不满足时,公共部门模型不应用于评价政策效果。Heckman通过理论分析认为,当存在未观察到的混杂因素时,PSM方法不仅可以消除系统误差,还会带来新的偏差。刘凤芹等人的蒙特卡洛模拟实验结果也表明,PSM对可忽略性强的假设非常敏感,即使是轻微的违规,PSM对坐果的估计偏差也超过50%;Kannika等人利用实际数据比较了参数法和PSM法的结果,进一步验证了PSM的应用需要“可忽略性强”的假设。

不可能为所有实验组个体找到控制组个体。匹配法只能为共同支持域的个体找到合适的控制个体。如果安置效应对于不同个体是同质的,共同支持域的错误确定不会影响政策效应的大小;相反,如果处置效应是异质的,共同支持域的假设使得一些实验组难以发现处置效应无法识别的“反事实”。换句话说,如果在匹配过程中丢失了大量的观察值,那么治疗效果的估计量在公共支持域中只具有一致的特性。在异质性反应中,如果实验组个体的处置效应差异很大,估计的ATT不能代表政策的平均回报。

数据量要求极高。匹配法常用于横断面数据。为了保证条件独立的假设,需要尽可能多地收集协变量信息来分离混杂因素。同时,为了找到与实验组个体特征最接近的对照组,研究者还需要收集大量的个体数据来保证结果的准确性。

结果的稳健性受到多种挑战的挑战。PSM方法计算的ATE或ATT的鲁棒性受干扰分配机制方程的设置和匹配算法的选择等多种因素的影响。刘凤芹等人的蒙特卡罗模拟实验结果表明,概率统计模型对误差项的分布不敏感,对隐指数方程的错位极其敏感。在公共支持域较小的情况下,PSM对选择带体的匹配方法极其敏感。

综上所述,Matching的应用必须满足一个强假设,并且有相当数量的数据。如果研究者认为可忽略性强的假设无法验证,手头数据样本不够大,就必须选择其他政策评估方法,如DID和样本选择模型,明确允许存在未观察到的混杂因素。

1.《政策评估 政策效应评估的四种主流方法(Policy evaluation)》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。

2.《政策评估 政策效应评估的四种主流方法(Policy evaluation)》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。

3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/yule/1765501.html