秋风带来凉爽,在学期开始的时候。本期为测量伙伴呈现一个开学套餐:如何使用双差法的交叉项(目前为止最全面的策略)。
差异中的差异(DID)无疑是实证研究中最常用的测量方法之一,交互术语是DID的灵魂。在测量实践中,依赖于数据的类型和性质,DID的交互项目具有不同的形式。灵活运用互动术语是实证研究中的一项重要技能。因此,本文全面梳理了文献中DID互动项目的各种形式,包括(1)传统DID;(2)经典DID;(3)不同时间DID;(4)广义DID;(5)异质的DID。
传统DID
双差法是研究“治疗效果”的常用方法。一般来说,DID的使用场景是在面板数据中,个体可以分为两类,即受政策影响的“治疗组”和不受政策影响的“对照组”。为此,引入了处理组虚拟变量:
但治疗组的个体只会受到治疗期政策的影响(之前没有受到影响),所以引入治疗期的虚拟变量:
传统DID的模型设置为
其中治疗组虚拟变量捕捉组效应(治疗组与对照组的内在差异),而治疗期虚拟变量控制时间效应(治疗期前后的内在时间趋势),这是其他控制变量,而交互项则代表治疗期内治疗组的真实效果,它们的系数正是我们所关心的治疗效果。然后执行OLS估计。
经典DID
DID使用面板数据,估计面板模型的标准方法是“双向固定效应”,既控制“个体固定效应”,也控制“时间固定效应”。研究者后来发现,传统的DID虽然控制了治疗组的组效应()和治疗期的时间效应();但其实我们可以做得更好,简单介绍一下双向固定效应模型,我们称之为“经典DID”:
其中是个体固定效应(回归时加入个体虚拟变量)和时间固定效应(回归时加入时间虚拟变量),而交互项前的系数仍然是我们感兴趣的加工效应。显然,加上个体固定效应后,就不再需要投入治疗组的虚拟变量;否则会导致严格的多重共线性,因为前者包含的信息比后者多(前者控制在个体层面,后者只控制在群体层面)。
同样,加上时间固定效果后,就不再需要放入处理周期的虚拟变量;否则会导致严格的多重共线性,因为前者包含的信息比后者多(前者控制每个周期的时间效应,后者只控制治疗周期前后的时间效应)。估计方法仍然是OLS,但必须使用聚类稳健的标准误差,因为面板数据通常是聚类数据。这种经典的DID模型在实证研究中最为常见。
不同时间DID
在传统和经典DID的模型设置中,隐含的假设是治疗组中的所有个体在完全相同的时间开始受到政策的影响。但是,有时候,每个个体的治疗周期并不完全一致(异质时序);例如,在不同城市分批推出试点政策。这时候就可以用“异类计时干了”。
不同时间DID的关键是,由于每个个体的治疗周期并不完全一致,治疗周期的虚拟变量因个体而异,所以应该写成(取决于个体I和时间t两者)。具体来说,不同时间DID的模型设置如下
在具体实施中,可以先在Stata中定义因人而异的治疗期虚拟变量。例如,考虑一个五阶段小组,对于第一个人,;对于第二个人,;第三个人。这意味着第一个人从第三期开始受到政策的影响,第二个人从第四期开始受到政策的影响,第三个人从未受到政策的影响(属于对照组);等等。
广义DID
上述所有DID方法都假设处理组和控制组之间存在差异,但有时一项政策会在全国范围内统一推广。此时只有处理组,没有控制组。还能用DID吗?答案是“可以”,可以试试“广义做到了”。
使用广义DID的重要前提是,虽然所有个体同时受到政策的影响,但是政策对每个个体的影响程度是不同的,可以用。
白和贾(2016,计量经济学)的研究就是一个经典案例,他们利用清代政府层面的面板数据考察了废除科举制度对革命起义的影响。自1911年废除科举制度以来,就没有严格的控制集团。但由于各地科举考试名额的巨大差异,各地废除科举考试的影响差异很大。
直觉上,如果某一届政府原来的科举名额很少,废除科举当然影响不大;相反,对于科举名额众多的政府来说,废除科举可能会引起剧烈的震动,通过阻挡众多学者的崛起而导致革命空。因此,白和贾(2016)以“科举名额占人口的比例”作为衡量标准。
在实践中,只要找到合适的变量(一般来自经济学理论),就可以替代经典DID的虚拟变量,广义DID模型设置如下:
其中交互项之前的系数仍然是我们关心的处理效果,然后对上面的公式进行OLS估计。
当然,对于广义的DID,文献中已经出现了更多“简单粗暴”的治疗方法,即人为设定一个阈值C,根据变量是否超过这个阈值来定义治疗组和对照组。具体来说,定义
然后,按照经典的DID。这种方法的缺点是阈值C的设置比较主观,所以一般需要进行“稳健性检查”,即考察不同阈值下的回归结果是否稳定。另外,将连续变量压缩成二进制变量时,很多信息明显丢失,在实践中很少见。
异构DID
传统的治疗效果模型一般假设“同质治疗效果”,即所有个体具有相同的治疗效果。显然,这个假设过于苛刻,无法在实践中成立。更合理的假设是“异质性治疗效应”,即允许每个个体有不同的治疗效应。
在DID的框架下,也可以引入异构处理效果,关键还是要调整交互项。为了简单起见,假设根据经济学理论,所有的个体都可以分为两类,用虚拟变量来表示。理论上,我们预计这两种类型的个体有不同的治疗效果。此时,异构DID模型可以通过在经典DID模型中引入三重交互项来构建:
从上面的公式可以知道,那种治疗组的个体的治疗效果是。对于治疗组的那些个体,治疗效果是。显然,对于这两类个体来说,处理效果是异质的(只要三重相互作用项的系数
意义重大)。
推而广之,如果经济理论认为所有个体都应该划分为M类来考察这M类个体的异质性效应,那么可以设置(M -1)类虚拟变量,例如,然后分别生成三重交互项,引入回归方程:
上式中,第一类个体的治疗效果为,第二类个体的治疗效果为
,等等。然后OLS的估计还是照常进行。
当然,双差法还有其他变体,如差中差(DDD)和PSM-DID结合倾向得分匹配。有兴趣的读者可以参考陈强(2014)。
引用
陈强,《高级计量经济学与统计应用》,第二版,高等教育出版社,2014
陈强,《计量经济学与Stata应用》,高等教育出版社,2015(好评如潮的配套教学视频可在网易云课堂购买)
陈强,《机器学习与R应用》,高等教育出版社,2020(即将出版)
陈强老师亲自授课《高级计量经济学与Stata应用》。2019年国庆(10月1-6日)现场开班(经济管理之家主办)。详情请点击页面下方的“阅读原文”或联系(根据付款顺序):
魏老师
QQ:2881989714
电话:010-68478566
邮件:vip@pinggu.org
我们聊天:13581781541
陈强老师介绍
陈强,男,1971年出生,山东大学经济学院教授,数量经济学博士生导师。
1992年和1995年分别获得北京大学经济学学士和硕士学位,之后留校任教。2007年,他获得北伊利诺伊大学数学硕士学位和经济学博士学位。曾在《牛津经济论文》(导文)、《经济学》、《比较经济学杂志》、《经济学季刊》、《世界经济》等国内外期刊上独立发表论文。他是最畅销的研究生教材《高级计量经济学与Stata应用》、本科教材《计量经济学与Stata应用》、广受好评的本科计量教学视频(网易云课堂)的作者。2010年入选教育部新世纪优秀人才支持计划。
(c) 2018年,山东大学经济学院陈强
www.econometrics-stata.com
转载请注明作者和出处
我们的任务是使计量经济学变得容易,并促进令人信服的实证工作。
1.《双重差分 开学礼包:如何使用双重差分法的交叉项(迄今最全攻略)》援引自互联网,旨在传递更多网络信息知识,仅代表作者本人观点,与本网站无关,侵删请联系页脚下方联系方式。
2.《双重差分 开学礼包:如何使用双重差分法的交叉项(迄今最全攻略)》仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。
3.文章转载时请保留本站内容来源地址,https://www.lu-xu.com/jiaoyu/1573458.html