非平稳时间序列的线性回归可能会导致虚假回归,即模型系数显著,R的平方较高,但变量之间可能并没有关系。
事实上,现实中很多时间序列都是非平稳的,存在一个单位根,极少数存在两个或两个以上的单位根。对于非平稳时间序列建模,1987年Engle和Granger的论文《Co-integration and error correction: Representation,estimation and testing》正式确定了该理论。
Clive W.J. Granger是众多经济学者的偶像
现实生活中,一些变量之间在短期上呈现分分合合的关系,但长期上看却具有相似的走势。这样的例子很多,比如短期和长期利率,短期可能会受一些突发因素影响发生分离,但最终又会保持较为同步的趋势和节奏。另外的例子包括收入和消费,进口和出口,货币供给,长期利率和商品价格之间等等。
如下图的长中短期利率,短期利率波动率明显大于中长期利率,但三者的走势都十分相似。
多数情况下,各含有一个单位根的非平稳时间序列的线性组合依旧是含有一个单位根的非平稳时间序列。这就是我们为什么要检测线性回归残差的原因。残差项就是各变量线性组合的值,如果不平稳,那么即使系数显著,R的平方很高,模型也是无效的。但是,如果残差是平稳序列,那么我们就说这些有一个单位根的非平稳时间序列之间存在协整关系。这就是Engle和Granger在1987年基于残差的协整检验方法。具体步骤:
1、首先,检验变量平稳性,可以利用ADF检验和DF-GLS检验等方法。如果所有变量都存在一个单位根就进入下一步,如果部分变量存在一个或多个单位根,那就是另外一个话题了,此处不表。
2、然后,利用最小二乘法对变量进行线性回归,得出残差项。再次对残差项进行单位根检验,如果残差不存在单位根,则所有变量存在协整关系。但必须注意的是,因为残差是一个最小二乘法的估计值,在样本量较小时会存在显著偏差,所以对残差的单位根检验虽然还是ADF检验时的t值,但需要选用另一套临界值。
Engle和Granger的这种利用残差检验协整关系的方法最为简单便捷,但存在三个主要缺陷,一是更换不同的应变量会改变残差值,以至于会产生不同的结果,这个问题在样本量较小时最为明显。第二,最小二乘法自身带有的误差会继续带进残差检验中。第三,这种方法只允许检验一种协整关系,即一组系数和变量构成的模型,但现实中,可能存在多重关系。
Johansen提供两种通过VAR模型的极大似然估计协整检验方法,克服了Engle和Granger方法中的大部分问题。
Engle和Granger起初只考虑了存在一个单位根和不存在结构突变的情况,这些问题都已经被广泛讨论,并出现了众多的解决方法。
非平稳时间序列建模和波动率建模是上世纪80,90年代计量经济学中发展最为重要的两个理论,都有丰富的研究结果。
领取专属 10元无门槛券
私享最新 技术干货