论文部分内容阅读
十九大报告指出,以新发展理念引领现代化经济体系建设,而宏观经济监测与预测是经济体系建设和调控的核心内容,其中CPI作为反映通货膨胀水平的重要经济指标,其预测可以为政府宏观经济调控提供重要依据。随着大数据时代的到来,实时、交互、离散化、非结构化的海量数据蕴含着经济社会运行的各种先行指标信号,同时数据处理技术和处理能力也相应地得到极大提升,引入高频大数据进行CPI预测变得更加重要和可行。本文在基于宏观低频数据进行CPI预测的研究基础上,引入适用于CPI预测的高频大数据——百度指数,并应用混频数据模型和具有流数据思维的方法对CPI进行预测,解决了以往因对影响因素厘清不够以及高频数据和低频数据的频率差异引起的预测滞后问题,进一步将CPI预测变量频率精确到日度,同时拓展了流数据类型的混频经济计量方法,实现了CPI的实时动态预测。本文首先使用百度指数数据构造了搜索热度指标,将互联网的飞速发展而引发的关键词搜索量自然增长和海量网民搜索行为的变动导致的关键词搜索量变动剔除,仅将经济社会事件对关键词搜索量的影响保留下来发现部分关键词搜索热度与CPI存在较强的相关关系,进一步通过时差相关分析法选取具有预测作用的强相关先行指标,用搜索热度并且以时差相关分析的相关系数作为权重合成高低频搜索指数,然后用构造的搜索指数分别构造低频数据模型和混频数据模型对CPI进行预测,与基准模型进行比较。在预测的过程中分别进行了样本内预测和样本外预测,其中MIDAS模型的样本内预测进一步采用了h步向前的MIDAS模型对CPI进行了实时预测,而样本外预测进一步对搜索指数的稳健性和模型的稳定性进行了验证,分别采用了静态预测、动态预测以及迎合了流数据特称的滚动窗口预测,得出以下结论:第一,在样本内预测中,混频模型的预测精度明显优于基准模型和低频模型,表明高频信息的充分无损使用改进了预测效果,避免了传统的低频数据模型由于人为加总降频处理造成的数据信息折损,从而在最大限度上使用了原始信息,在估计和预测上表现更为真实和可靠。第二,使用h步向前预测的mMIDAShpARK)(),,(-模型对CPI进行实时预测时可以领先官方数据29天。与低频模型相比,混频模型不仅在预测精度上具有优势,而且提高了预测的时效性,使预测结果随着新数据的到来得到更新,而相对于基准模型,混频数据模型的优势主要体现在充分使用高频信息至当月下旬时预测精度的显著提升。第三,在动态外推预测中,混频数据模型在预测精度和趋势拟合上具有显著优势,可以领先官方数据34天,进一步提高了预测的时效性,具有很强的实用价值。外推动态预测不仅验证了搜索指数的稳健性,也进一步证实了混频数据模型在预测精度和时效性上的双重优势。第四,用更适合流数据的滚动窗口技术对CPI进行滚动窗口预测,预测值对于2016年6月至2018年7月CPI变动趋势拟合效果较好,与静态预测的趋势也基本保持一致,说明模型的稳定性较好,且在整个样本区间内没有发生明显的概念漂移。