论文部分内容阅读
随着互联网的普及,以自媒体及社交网络为来源的新闻消息日益增多,但主流的媒体、报道仍是我们得知较为官方可信的消息的重要途径,许多经济热点事件都是通过这些报道为公众所知晓的。同时,主流的经济媒体报道较为正式,聚焦有社会历史意义的时事,有一定的记录意义,是当时社会主要经济事件的一个缩影,反过来也影响了公众对于社会乃至世界经济的判断和预估。本文选取《每日经济新闻》这样一个国内顶级的权威经济报刊,由于版面限制,其上的文章总量较为固定,发行日期稳定,其电子版保存信息很完整,在很大程度上是对近期经济事件及人们关注热点的一个映像,它一方面对公众主观判断经济形势产生影响,另一方面聚焦时事,受经济变化趋势影响而出现不同的表现。本文研究了《每日经济新闻》的词频分布情况,发现一些不固定词语的频数会随着某一特定事件而有很大波动,能对经济热点的事件发生有代表性,而当某一词汇出现量突然变化时,显著改变了当天的整体词频分布。这种变动的词频密度分布是对经济热点爆发的一个具化表现,是我们所感兴趣的。本文的创新点主要体现在:首先,由于这是一个连续的密度分布的时间序列数据,本文使用基于Wasserstein距离的密度分布(自)回归模型。这一模型目前在国内的实证研究中还没有得到很好的利用,Wasserstein距离的密度分布(自)回归模型对密度本身不假定有任何特定的参数形式,因此对未来未观测到的密度的预测更加灵活,本文给出了这一模型在词频密度分布上的具体处理及预测方法,得到了准确的估计量,可以简单称作系数估计量。不局限于单一的系数估计,我们也给到了随时间变化的这一系数及通过Moving Block Bootstrap滑动块抽样方法得到的系数的渐进正态分布。其次,为了更好的解释词频密度分布及其Wasserstein回归系数的意义,我们选取上证综合指数的成份股,建立了以天为单位的所有成份股价涨跌幅的密度分布(自)回归模型,来进行对比。发现从系数估计量来看,两者的密度分布变化有很大的相似性,这说明《每日经济新闻》的词频密度分布确实随经济趋势而变化。这为我们理解基于Wasserstein距离的密度分布(自)回归模型的现实意义提供了支持。进一步,通过基于Wasserstein距离的密度分布(自)回归模型,我们建立了媒体报道与股票市场的涨跌幅变化之间的联系,利用因果检验得到了媒体报道与股票波动之间的因果关系,也给出了预测股票变化的一种创新的方法,不同于简单的对股票某一单一统计量,如期望的预测,这种预测给出了具体的涨跌密度分布,在准确度上也令人满意。