论文写作|排除干扰因素、机制测试和异质性分析
论文的实证部分一般回答两个问题,一是核心解释变量X是否影响被解释变量Y,二是具体影响机制,即X如何影响Y。
为了回答第一个问题,在基准回归之后,论文一般会设计一系列的辨识条件检验和稳健性检验,包括检验模型的具体假设(如DID的平行趋势检验),讨论、检验和缓解模型可能出现的因果推断问题(内生性),排除其他可能影响研究结论的干扰因素,讨论X对y的预期效应和滞后效应,在某些情况下, 基准回归结果的辨识条件检验和稳健性检验甚至需要占据一半以上的实证部分。
一方面,回答X是否影响Y的问题是进一步分析影响机制的基础,因此保证X对Y影响的稳定性和可信度是实证设计的基本要求;另一方面,要在读者或审稿人提出“灵魂拷问”之前,考虑到论文中可能存在的所有问题,想想读者的想法,想想审稿人的想法。虽然无论我们如何绞尽脑汁去寻找和填补这些漏洞,审稿人总能问出一些“奇怪”的问题,但是前期做足了工作,就能把这些问题被问到的可能性降到最低。
回答第二个问题可以增加论文的科学性、故事性和丰满度。x对Y有一定的影响,而且这种影响是稳定的。在此基础上,我们还想知道X对Y的影响是通过什么渠道实现的,即探究“存在”背后的“过程”。对客观影响机制的探讨,实质上是对实际经济运行规律的总结和提炼,体现了社会科学研究的“科学性”。
如果怀疑变量M是X对Y的作用背后的机制,那么本文的理论分析部分会清晰地分析解释这一机制的基本逻辑,然后在实证部分对这一机制进行检验。机理检验没有固定的范式,一般需要结合论文的研究内容、理论、模型甚至所用数据进行设计。但经济研究的机制检验要尽量避免使用中介效应模型,因为(引自我在知乎的回答):
与管理学、心理学等学科相比,经济学更强调变量之间因果关系的推断,而正是因为中介效应模型没有考虑中介变量可能存在的内生性,所以模型可能符合管理学的研究范式,但不符合经济学的研究范式。
中介效应模型可能的内生性在于:
参考连老师的回答,中介效应模型存在一个现实问题:我们大多数人都在纠结一个内生变量,而中介效应要求我们不仅要克服内生问题,还要克服内生问题,这真的很苛刻。
排除干扰因素是实证论文稳健性检验的基本步骤之一。
例如,陈登科(2020)怀疑中国加入世贸组织后同时实施的其他政策,特别是重组国有企业和鼓励外资的政策,以及环境监管政策(如两个控制区和“十一五”污染控制政策)可能会潜在地干扰结果。为了消除这些干扰因素,作者进一步将国有经济和外贸经济的比重加入回归方程,以控制前两项政策的影响;关于环境规制政策,笔者认为我国大部分环境规制政策是按行政区划实施的,因此在回归模型中进一步加入了地区-年度固定效应,以控制环境规制政策对结果的潜在影响。
例如,江等人(2018)在研究农村成长经历对家庭股市参与的影响时,认为影响人的行为的因素非常复杂,因此怀疑农村成长经历对股市参与的影响可能受到社会交往、信任水平、金融知识、家庭社会经济地位和风险态度的干扰。为了消除这些因素,作者做了一系列鲁棒性测试,包括(以社交为例):
再比如,鲁静等人(2021)怀疑2008年的国际金融危机和同期的环境监管政策(如清洁生产标准、十一五污染治理政策、区域审批限制等)可能会干扰研究结论。对于前者,作者在基准模型的基础上额外控制了两个代表企业投融资需求的代理变量;对于后者,作者引入了一些哑变量,排除了相关样本(详见原文)。
借鉴以上三个文件,我们先简单梳理一下排除干扰因素的逻辑和实证思路。
由于被解释变量Y的影响因素较多,基准模型中的控制变量仅根据常识和理论(即现有文献的实践)引入。如果怀疑某个不寻常的意外因素Z对Y有一定程度的影响,则直觉认为Z是不可忽视的重要影响因素,考虑Z时X对Y的作用可能发生变化。然后,为了检验结论的稳健性,可以将Z作为控制变量引入基准模型。如果核心解释变量X的系数与基准回归结果基本一致,则意味着Z对研究结论的干扰被消除。
另外,还可以用反证法,即假设Z确实干扰了研究结论,有如下推论:随着Z值的变化,X对Y的影响是异质的,我们的检验逻辑是证明这个推论不成立。为了证明这个推论不成立,有两个经验思路:一是按照z的值对样本进行分组,进行分组检验。如果x的系数在不同组下基本不变,与基准回归结果基本一致,说明这个推论不成立;二是使用调节效应模型,其中调节项为X和Z的交互项,两个独立项不可忽略。如果调节效应模型中的交互项不显著(个别项X是否与基准回归结果一致,甚至X是否显著并不重要,因为X的系数在调节模型中有不同的含义),则意味着推断不成立。
机制测试没有统一的范式,一般是依靠研究内容来支持论文中讲述的故事。比较常用的实证设计包括(引用我在知乎的回答):
戴等人(2021)在研究“沪股通”对企业全要素生产率的作用机制时,认为提高股票价格的信息含量和信息传递效率、纠正股票错误定价和提高信息披露质量是沪股通提升企业全要素生产率的主要机制。在机制检验部分,首先实证检验沪股通开通对这些机制变量的影响,然后利用现有的权威文献从理论上探讨机制变量对企业全要素生产率的影响。
陈登科(2020)的机制试验思想与之相似,但在逻辑上与他自己的研究内容密切相关。贸易自由化显著降低了企业的排放强度,等于排放量除以工业总产值。为了讨论企业排放强度的降低是源于排放量的减少还是工业总产值的增加,作者用贸易自由化分别回归了企业的排放强度和工业总产值。结果表明,贸易自由化主要是通过减少企业的排放而不是增加产出来降低排放强度。在此之后,一个新的问题是:企业排放量的减少,是生产过程中产量的减少,还是终端处理过程中处理能力的增加?为了回答这个问题,作者用贸易自由化来分别回归产生的量和去除的量。结果表明,贸易自由化通过减少产生量而不是增加清除量来减少排放。
这样的机制测试思路是有逻辑联系的,所以论文的故事性很强。此外,本文还分别检验了煤炭利用和技术进步的两个具体渠道。
异质性分析一般可以分为两种类型:
这两种方法的主要区别在于:
事实上,异质性分析可以作为机制测试的辅助手段,进一步增强论文的故事性。
如万攀兵等人(2021),在用清洁生产行业标准研究企业绿色转型时,在验证了技术改造的具体机理后,认为技术改造受制于企业的技术改造需求和融资能力,基本逻辑如下:
按照上述逻辑,作者加入了技术改造需求和融资能力与双差的乘法项(即构建三差模型DDD),以捕捉可能的异质效应。