计量经济学问题

不知道从什么时候开始,回答测量题成了我日常生活的一部分。来自世界各地的读者向他们的同事提出了各种测量问题。下面是几个典型问题,希望对从事实证研究的朋友有所帮助。

1,在什么情况下,回归前变量应该是对数?

答:可以考虑以下几种情况。

如果理论模型中的变量是对数的,那就应该是对数的。例如,在劳动经济学中,教育投资回报率的决定因素通常是作为解释变量的工资的对数,因为它是从明瑟模型中推导出来的。

第二,如果变量有指数增长趋势,比如GDP,一般是对数,使得lnGDP成为线性增长趋势。

再次,如果取对数可以提高回归模型的拟合优度(如R2或显著性),可以考虑取对数。

第四,如果要把回归系数解释为弹性或半弹性(即百分比变化),可以取变量的对数。

第五,如果不确定是否应该取对数,这两种情况都可以作为稳健性检验进行估计。如果两者的回归结果相似,说明结果是稳健的。

2.如何理解线性回归模型中交互项系数的经济意义?

答:在线性回归模型中,如果没有交互项或平方项等非线性项,则一个变量的回归系数表示该变量的边际效应。例如,考虑回归方程。

y = 1 + 2x + u

其中u是随机扰动项。很明显,变量X对Y的边际效应是2,即X增加一个单位,Y平均增加两个单位。考虑向模型中添加交互式项目,例如

y = α + βx + γz + δxz+ u

其中,x和z是解释变量,xz是它们的交互项(交叉项)。由于交互作用项的存在,X对Y的边际效应为β+δz,说明X对Y的边际效应不是常数,而是取决于另一个变量Z的值,如果交互作用系数δ为正,则X对Y的边际效应会随着Z的增加而增加(如劳动的边际产出正依赖于资本);另一方面,如果δ为负,X对Y的边际效应会随着z的增大而减小。

3.在一些期刊上可以看到,回归模型中引入了控制变量。控制变量起什么作用,应该如何确定?

答:在研究中,通常存在主要关注的变量,它们的系数被称为“感兴趣的参数”。但是,如果只对主要关注的变量进行回归(极端情况下为一元回归),就容易出现遗漏变量偏差,即遗漏变量与解释变量相关。增加控制变量的主要目的是尽量避免遗漏变量的偏差,所以应该包括影响被解释变量Y的主要因素(但允许遗漏与被解释变量无关的变量)。

4.很多文献中都有“鲁棒性测试”一节。是不是每个实证研究都要这么做?具体怎么操作?

答:如果你的论文只报告了一个回归结果,别人很难相信你。因此,我们需要做更多的回归,即健壮性检查。没有经过健壮性测试的论文很难在好的期刊上发表,因为它们没有说服力。稳健性检验方法包括变换函数形式、划分子样本、使用不同的测量方法等。请参考我的课本。更重要的是,借鉴同领域的经典文献,模仿其鲁棒性测试。

5.面板数据一定要推敲固定效应和时间效应吗?还是可以直接返回?我看过很多文献,有的是解释使用固定效应模型的原因,有的是直接返回结果。正确的方法是什么?

答:标准做法要求豪斯曼检验在固定效应和随机效应之间进行选择。但是,由于固定效应是普遍的,固定效应模型总是一致的(随机效应模型可能不一致),一些研究者直接估计固定效应。

同时还考虑了时间效应,比如添加时间虚拟变量或时间趋势项;除非经过测试,发现没有时间效应。如果不考虑时间效应,你的结果可能不可信(也许X和Y的相关性只是因为两者都随时间增长)。

6.如何决定使用两阶段最小二乘法(2SLS)还是广义矩估计(GMM)?

回答:如果模型精确辨识(即工具变量个数等于内生变量个数),GMM完全等价于2SLS,所以用2SLS就够了。在过度识别的情况下(工具变量多于内生变量),GMM的优势是在异方差的情况下比2sl更有效。因为数据中存在一点异方差,所以在过度识别的情况下一般使用GMM。

7.在面板数据中,感兴趣的变量X不随时间变化。能否只估计随机效应(如果用固定效应,去掉不随时间变化的关键变量X)?

答:通常使用固定效应模型更好(当然,可以进行正式的houseman测试来确定是使用固定效应模型还是随机效应模型)。如果使用固定效果,有两种可能的解决方案:

(1)如果系统GMM用于估计动态面板模型,则可以估计时不变变量x的系数。

(2)在使用静态面板注视效应模型时,我们可以引入非时变变量X和一个时变变量Z之间的交互项,将交互项xz(时变)作为关键解释变量。