中文 / English
李鲲鹏

QQ截图20170414163707.png

作者:李鲲鹏

毕业院校:清华大学

导师:李子奈&白聚山

 

主要内容


随着经济统计工作的不断发展,现在的经济学家可以享受海量信息为经济研究带来的巨大便利。然而,这种以海量信息为特征的高维数据却为理论分析提出了严峻的挑战。传统的理论体系都是将其研究的对象局限在低维数据上,如何将理论推广到高维数据是目前计量经济学家面临的重要课题,它构成了近二十年来计量经济学研究的主流之.--。

 

本文的研究集中于这一主流研究领域的重要分支一一高维因子模型上。高维因子模型是目前计量经济学中的一个重要模型。以美国美联储前主席BenBernanke,哈佛大学教授JamesStock以及普林斯顿大学教授Mark Watson为代表的欧美学者,在广泛的实证研究中发现,经过高维因子模型增广的计量模型在宏观经济预测(Stock and Watson, 2002, JBES)、政策效果评价(Bernanke, Bovin and Eliasz, 2005, QJE)以及经验事实挖掘(Kose, Othok and Whiteman,2003, AER)上有着非常好的表现。

 

为高维因子模型的理论分析做出了重要贡献的是Stock and Watson(2002, JASA).Bai and Ng(2002, Econometrica)以及Bai(2003, Econometrica)。特别是后者,为高维因子模型的主成分分析奠定了分析框架。然而,现有的绝大部分文献都局限于主成分方法上。在传统的因子模型中,主成分方法只是极大似然方法的特例:极大似然估计量在扰动项是独立同分布的情况下退化为主成分估计量;如果独立同分布的条件不满足,极大似然估计量将优于主成分方法估计量。虽然很多计量经济学家认识到高维因子模型极大似然分析的重要性,但是整个文献在这一领域并没有取得明显的进展,如何为高维因子模型的极大似然分析建立分析框架仍然是一个世界性空白。

 

本文较为彻底地为高维因子模型的极大似然分析建立了分析框架并对其进行了拓展.在第2章,极大似然分析框架得以确立。我们是通过三个方面完成这一目标的。首先我们解决了一致性没有良好定义的问题。在高维环境中,被估计的参数个数也是发散到无穷的,这使得传统计量分析中的一致性概念没有良好的定义;其次,我们给出了详尽的方法去证明高维因子模型中的一致性,并导出了渐近分布;最后,我们给出了五种流行性识别策略下的基准结果。不仅如此,鉴于通常的Newton-Raphson算法在优化高维因子模型目标函数上的低效率,我们针对性地设计了EM算法。计算机上的蒙特卡罗试验证实,极大似然估计量有着优良的有限样本性质。在一个20 X 40的小样本中,计算机.上的模拟值与我们分析给出的理论值已经非常吻合。本章建立的分析框架有非常突出的优点:现行主成分分析框架能够解决的问题,新的极大似然分析框架都能够解决,而且来自新分析框架的估计质量要高于现行分析框架;同时,新的分析框架还能够解决现行分析框架不能解决的问题,例如受约束的因子模型。

 

本文第3章将第2章建立的分析框架拓展到存在交互效应的面板数据模型中。交互效应面板模型是通常面板数据模型的推广,同时有着很强的经济学含义,在宏观、微观、劳动、金融等多个领域都有着广阔的应用空间,是目前计量前沿研究的热点(Pesaran,2006,Econometrica; Bai, 2009, Econometrica等)。在第3章中,我们考察的是一个基准模型,即解释变量和回归方程扰动项共享相同的因子。由于新的分析框架的优势,相比较于现有文献给出的有限信息极大似然估计法,本文首次使用了完全信息的极大似然估计法。本章的研究显示,与有限信息极大似然估计在横截面异方差的情形下是有偏估计所不同,完全信息极大似然估计量对横截面异方差是稳健的。不仅如此,完全信息极大似然估计量有着更小的渐近方差。在这一章中,针对优化目标函数的困难,我们同样设计了EM算法。并应用设计的EM算法检查了完全信息极大似然估计量的有限样本性质。模拟试验证实,该估计量有着优良的有限样本性质。本文第4章则将第3章考察的模型进行了推广,使其与Bai(2009,Econometrica)考察的模型相一致。

 

在最后一章中,我们给出了一个在华尔街投行中被广泛使用的盈利模型。与通常的ARCH,GARCH模型为单支股票进行建模不同,我们给出的模型是为整个市场的所有股票进行建模,并将市场之间的状态转移建立在不可观测的基本面之上(共同因子)。我们指出了这种建模思路逻辑上的合理性以及信息上的巨大优势。最后,我们基于这一模型指出了进一步研究的方向。

 

主要创新


本博士论文的主要创新点是为高维因子模型的极大似然分析建立了完整的分析框架,填补了这一世界性的理论空白。传统的因子模型有两种估计方法:-种是主成分方法一种是极大似然估计方法,而主成分方法是极大似然估计方法的特例。在扰动项是独立同分布的条件下,极大似然估计量退化为主成分估计量;当独立同分布条件不满足时,极大似然估计量将优于主成分估计量。这两种估计方法在高维下也是成立的,Bai(2003, Econometrica)为高维下主成分方法建立了分析框架,但是高维下极大似然方法的估计框架却迟迟没有建立起来,属于世界性的理论空白。本博士论文很好地解决了这一理论问题, 填补了这一理论性空白。在解决这一理论问题的过程中,我们从如下几个方面为理论计量分析作出了贡献:


首先,高维下被估计参数的个数是发散的,传统的参数-致性概念不再具有良好的定义。标准的Newey and McFadden(1994, Handbook of Econometrics)-致性论断不再适用。因此,为建立-致性必须使用新的论断。为解决高维下参数一致性定义的问题,我们将一致性建立在某种范数意义下。本博士论文通过选择经过维度矫正的Frobenius范数,很好地解决了这一问题。其证明的思路也适用于其他高维的情形,可以视为我们为统计学和计量经济学理论分析作出的重要贡献。

 

其次,由于因子模型的识别问题,现有的文献将渐近理论都建立在某个旋转矩阵的基础之上。本博士论文给出了完全识别这些参数的识别条件,因此现有文献中,渐近表达式里的旋转矩阵退化为单位阵。但是旋转矩阵退化为单位阵的渐近性质是什么样的尚无人研究,也不知道如何研究。本文对这一问题给出了一个圆满的研究方案。我们的研究发现,不同的识别条件下,旋转矩阵退化为单位阵的渐近性质是完全不一样的,并最终影响了载荷参数和因子的渐近表达式和极限分布。

 

再次,本文提出的极大似然估计方法的目标函数相比较于主成分方面的目标函数,有着更强的非线性性。同时,我们的识别条件还是非线性性的,并且还要额外地估计高维的横截面异方差。另外,极大似然估计是联合估计,估计参数之间具有相互依赖性。所有这些都使得本文的极大似然估计方法相比较于主成分估计方法更复杂、更困难。本文提出的分析方法,很好地解决了以上难点。其相关的论断具有原创性的贡献。

 

最后,针对极大似然函数的优化问题,本文借鉴EM算法的思想,针对性地设计了高维因子模型的EM算法。新的EM算法具有良好的表现,不仅在N小T大的环境下收敛良好,而且在N大T小的环境下,也有稳健的表现。

 

不仅如此,本文还将新建立的极大似然分析框架拓展到了存在交互效应的面板数据模型中,交互效应面板模型是新兴的计量经济学研究热点,在宏观、微观、劳动、金融等多个领域有着广阔的研究空间。相比较于已有文献给出的有限信息的极大似然估计方法,本文借助于新的极大似然分析框架,首次给出了完全信息的极大似然估计法。新的估计方法对于横截面异方差有着稳健的表现。在交互效应面板模型中,其理论研究又面临新的问题:首先,扰动项的方差是分块对角矩阵,而不再是简单的对角矩阵;其次,载荷参数中可能有很多的零约束;再次,被估计参数又额外的多了- -组斜率参数。为了解决这些理论问题,我们深化并进一步发展了前面的极大似然分析框架的论断,最终成功地解决了这些理论新问题。

 

最后,博士论文的最后- -章指出了一些有价值的研究方向。该研究方向与第二章的部分结果最终发表在了Review of Economics and Statistics上。