有哪些有趣的工具变量?
第一个是1991年的QJE。克鲁格的复杂的上学率影响上学和认真吗?。本文研究一个老问题:教育对收入的影响。我们知道,由于变量缺失的问题,直接OLS回归会出现内生性问题。本文考虑到,由于美国的义务教育受年龄限制,一月份出生的人可以在一定年龄之前离校,但六月份出生的人必须在学校呆到六月份,因此不同月份出生的人会在不同的时间结束教育,但他们开始接受教育的时间是学校开学的时间。因此,出生月份会影响受教育时间的长短。所以本文用你是否出生在第一季度作为教育时间的工具变量,发现工具变量的结果与OLS的结果没有显著差异。这个工具变量后来也受到了质疑,因为它是一个弱工具变量,出生月份对受教育时间的影响很小,即使出生月份和缺失变量之间只有弱相关,估计结果也会有相当大的偏差。
第二个是生活收入和越南时代的抽签:来自1990 AER上安格里斯特的社会安全管理记录的证据。这也是他的博士论文作品。本文研究的是越战经历对后续收入的影响,这显然是一个内生问题。笔者注意到,国防部征兵时,对适龄男性抽一个征兵抽签号,然后设一个上限,人数少于这个上限的都在征兵范围内。于是他把选秀人数是否小于这个上限定义为选秀资格。显然,征兵资格为1的人更有可能参加越战,而这个数字是随机抽取的,所以征兵资格是一个合适的工具变量。这是一个巧妙利用自然实验的例子。
最近又知道一个有趣的。1998 AER &;埃文斯的子女及其父母的劳动供给:来自家庭规模外生变化的证据。本文研究了子女数量的增加对父母参与劳动力市场的影响。这里的问题是找到一个影响孩子数量的外生冲击。这方面的研究有的用双胞胎,有的用流产失败。当然,双胞胎的出生一般是随机的,并不是在预期中设计的,所以这是一个直接增加孩子数量的外生影响。本文考虑了一个间接增加孩子数量的因素,即前两个孩子的性别构成。为什么这会影响孩子的数量?他们的理论是这样的:父母一般希望孩子的性别构成多样化,所以如果前两个孩子都是男孩或女孩,他们就希望再要一个性别不同的孩子。但是如果前两个孩子有一个男孩和一个女孩,性别多样化的任务已经完成,不会再有孩子,那么相同性别的家庭会有更多的孩子。我觉得这个想法真的很神奇。简而言之,寻找工具变量就是开动脑筋,大胆联想。