论文部分内容阅读
传统金融学认为投资者是“理性人”,当市场出现波动价格偏离价值时会立即纠正这种偏误,而上世纪七十年代末以来,金融市场出现了许多有悖传统金融理论的异象。对此,行为金融学基于心理学等视角研究了投资者在参与市场过程中的心理特征与决策行为,并形成了较为完整的理论体系。行为金融学的一个重要研究内容为投资者情绪,其中投资者情绪的量化是相关研究的基础与重点。大数据时代前,学者们主要是选取一些如成交量、换手率等能够反映股票市场总体发展状况的指标作为情绪的代理变量,这类变量无法全面反映投资者情绪变化,且只能从客观上反映投资者情绪。大数据时代的到来,互联网数据的大量、全面、实时、真实等特点为投资者情绪指数的编制提供了更全面的数据基础,同时随着机器学习等技术的不断成熟,原先因为技术限制而无法获取和利用的数据逐渐被学者们纳入到可以研究的范围内,因此,基于大数据构建投资者情绪指数是一种相对客观且准确的情绪度量方法。本文主要研究了投资者情绪指数的构建及其与我国股市的影响关系。关于投资者情绪指数构建方面,首先基于大数据视角下投资者情绪的界定,选取了能反映投资者情感倾向的“用户评论内容”与能反映投资者关注度的“用户发帖量”构建了指标体系。然后基于数据获取与预处理模块,机器学习分类模块,投资者情绪指数编制模块三大部分介绍了投资者情绪指数构建的方法。最后本文基于大数据技术获取了东方财富网上证指数股吧的海量文本数据并进行了预处理,通过构建LSTM机器学习模型分类出用户评论数据中蕴含的情绪并统计出每一个交易日用户评论数据中积极、消极、中性情绪的帖子数量,计算出日度投资者情绪指数并进行了有效性检验,为投资者情绪的相关研究提供了基础性工作。关于投资者情绪指数的应用方面,本文分别构建了投资者情绪与股票市场收益率及股票价格波动率的向量自回归模型,研究投资者情绪与股市收益及波动的关系,实证结论为股市收益率与投资者情绪互为格兰杰原因,投资者情绪变化可以显著影响股市收益,同样股市收益变动对投资者情绪具有明显影响;股市价格波动率与投资者情绪为单向格兰杰原因,投资者情绪变化可以显著影响股市波动率,而股市波动率对投资者情绪的影响不显著。本文的创新点主要有:1、构建了LSTM机器学习分类模型挖掘海量用户评论数据中蕴含的情绪,此模型能够为内容较长的用户评论的分类问题提供更好的解决方法。2、投资者情绪指数的编制公式中,不仅考虑了积极、消极情绪的帖子数量,还考虑了表达中性情绪的帖子数量。3、投资者情绪指数的应用方面,区别于以往实证研究中将股市波动与收益一概而论,本文分别研究了投资者情绪与股市收益及价格波动的影响关系。