基于BERT模型的金融新闻舆情对股票收益率影响研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:nemosan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在金融市场中,金融新闻承担着传播和评价有关公司管理、高管言论、企业经营情况的任务,在市场中扮演着重要的作用,市场中的交易者在接收到金融新闻所传递的信息之后,会根据其自身的判断和观念形成对事件的认知,并依据这一认知采取相应的行动,因此,研究新闻情绪,特别是研究网络金融新闻舆情对于社会具有重大意义。现有的研究往往通过构建情绪词典或者依据词频提取语言特征,并采用机器学习模型提取情绪的方式来实现新闻舆情的识别与抽取,虽然这类方法的可解释性相对较强,但由于这类方法基于词袋模型的假设,忽略了词法和语法对于语句内容和情绪表达的影响,致使该类方法在识别情绪准确率上存在较大误差。而在深度学习自然语言处理模型中词的分布式表征方法和卷积、循环、Transformer神经网络的运用能够更好抽取和利用文本中的语义信息,在大量公开数据集上的研究表明,基于深度学习的情绪识别模型在准确率上要强于传统方法。BERT模型是基于预训练的神经网络模型,这一模型通过使用大量外部文本进行自监督预训练的方式为参数学习到良好的先验状态,从而能够在下游监督学习任务上产生较好的表现,而Gururangan(2020)则提出使用领域内外部文本在自监督预训练后再次进行预训练的方法,能够进一步提升BERT模型处理特定领域文本的能力。本文分析对比了各类模型在金融新闻舆情识别与抽取准确性上的差异并通过实验证明了在经过金融文本适应性预训练后,BERT具有较好的舆情识别能力;通过运用该模型在涉及个股的新闻进行舆情识别后构建金融新闻舆情指标,在2017年到2020年上半年的历史数据上回测并分析信息系数、分组回测表现并与中证500指数进行对比,发现基于BERT模型的金融新闻舆情指标对股票市场收益率具有较好的预测能力。为了研究对比各类模型金融新闻舆情抽取与识别的性能,本文通过人工标注和外部混合的方式获取一万三千条新闻舆情样本,将每条样本标注为积极、中性或消极中的一类,并分别使用基于传统机器学习的朴素贝叶斯模型、TF-IDF特征提取与逻辑回归模型和基于深度学习的Text CNN、Text RCNN、Attention LSTM等经典深度学习模型与基于预训练的BERT模型以及在金融文本上进行适应性预训练的BERT模型在上述样本上进行训练与测试,并通过准确率和F1两个评价指标评价模型的表现;通过对比基于机器学习模型、经典深度学习模型、未进行适应性预训练的BERT模型和使用外部金融文本进行适应性预训练的模型在上述样本上的表现,本文得到加入外部金融文本进行领域内适应性预训练的BERT模型在识别情绪的F1指标和准确率指标上表现超过其他模型的结论。为了计算个股在每日的金融新闻舆情指标,本文使用加入外部金融文本进行领域内适应性预训练的BERT模型对三百余万条涉及个股的金融新闻进行舆情识别,得到每条金融新闻在正面、中性、负面情绪上的概率分布,计算金融新闻情绪指标,并平均当日涉及个股的所有新闻情绪指标并在时间序列上取十四个自然日的简单平均,得到最终金融新闻舆情指标。为了研究基于BERT的金融新闻舆情指标对股票市场收益率的影响,本文采用信息系数及相关指标研究金融新闻舆情指标与其下一期收益率之间的相关性以及相关性的稳定程度;使用分组回测的方式,每期将新闻舆情指标取值不为空的股票分为五组分别持有并在下一期进行调仓,验证该指标对于个股收益率预测的单调性;使用金融新闻舆情指标对下一期收益率进行回归并验证该指标的预测能力,除此之外,还利用金融新闻舆情指标构建策略并在考虑冲击成本和交易成本的基础上进行回测;实证研究表明金融新闻舆情指标与下一期收益率之间相关性较强,而相对极端的金融新闻舆情能够对个股收益率具有较好的区分效果,回测结果显示,通过金融新闻舆情指标构建的策略显著优于持有中证500指数的基准,由此得出金融新闻舆情指标对个股下一期收益率具有较好的预测能力的结论。
其他文献
2005年联合国第一次提出有关普惠金融的概念,而数字普惠金融的概念则是在2016年首次由二十国集团提出并推广。我国对于数字普惠金融的发展表现出了极高的重视。习近平总书记于2019年在中共中央政治局的讲话中强调要深化金融供给侧结构性改革,增强我国金融机构服务实体经济的能力和水平。数字普惠金融对于我国打赢脱贫攻坚战也是重要的一环内容。而我国的金融市场是以银行为框架与支撑的金融体系,银行作为传统金融领域
学位
如今关于资产价格的研究文献更多集中于尾部风险和预期资产收益的横截面之间的关系。事实上,风险厌恶投资者会更加关注尾部资产收益,这主要是因为尾部事件可能导致投资组合的市值大幅下降,这些尾部事件代表了边际效用高的状态,投资者如果持有可能因尾部危险较高的资产时,会要求更高的预期收益。并且近年来公募基金在我国越来越受到投资者的欢迎,投资公募基金具有分散投资、专家理财的特点。而公募基金所投资资产由基金经理决定
学位
韩国资本市场的公司债比重大幅增加,其重要性也逐渐受到重视。截至到2020年,根据韩国KOSIS(Korean Statistical Information Service)数据,韩国资本市场债券发行余额达到2,263万亿韩元,其中公司债的比重为380万亿韩元,约占债券发行总余额规模的16.7%。特别是,韩国企业更喜欢通过发行与银行贷款相比成本较低的公司债来融资。因此,公司债在韩国资本市场上,其重
学位
熊彼特在1934年提出了企业家精神及“创造性破坏”活动对社会创新和经济发展的重要性,并由此开启了学术界对创业相关话题的热烈讨论。近年来,随着国家的支持与引导,我国居民个体的创业热情得到有效激发,全社会形成了“大众创业、万众创新”的繁荣局面,这为提高创新能力、促进经济高质量发展提供了强有力的支撑。因此,研究中国居民创业选择的影响因素具有充足的理论价值,而进一步分析这一过程的作用机制对现实实践也有一定
学位
本文主要研究私募股权投资及其异质性对企业上市后绩效的影响,通过梳理文献、相关理论基础以及整理私募股权投资市场发展现状,我们发现私募股权对上市企业绩效的影响众说纷纭,至今未有统一定论。支持者认为,私募股权投资机构会通过提供资金及资源扶持、加强外部监督管理作用等方式提高企业经营绩效,从而赚取企业估值上升的回报。而反对者则认为,受制于私募股权投资机构与社会投资者、被投资企业之间的双重委托代理理论及逐名理
学位
改革开放以来,我国经济前期的粗放式发展带来了一系列环境问题,如气候异常、物种减少、能源的快速下降等等,对我国经济的健康可持续发展造成了一定程度的影响与限制。大力发展绿色产业正是解决这一问题的良好举措,为了解决绿色产业前期资本投入大、融资难的问题,专门服务于绿色产业的融资工具应运而生。由于绿色债券具有融资规模大、形式灵活、发行要求相对不高与融资成本合理等诸多优点,很快得到了政府与监管机构的大力扶持。
学位
证券投资活动中,由于个体获取消息的渠道不同,可获取的信息量存在差异,而信息与投资决策行为、投资绩效又存在一定联系。现有文献大部分认为基金经理社会网络中心性与基金绩效存在相关性,但不同市场环境下社会网络对绩效的影响程度与方向存在一定差异。此外,研究者更大的分歧在于基金经理社会网络是如何影响基金绩效的,是通过选股还是择时?通过分析基金经理网络中心性与信息获取的关系、信息对择时能力选股能力的影响机制以及
学位
新《预算法》自2015年开始实施,其中对于地方政府预算管理及预算外资金的规定对地方政府的城投债融资将产生重大影响,但由于新《预算法》正式时间不长,前人关于此问题的研究较为少见。本文希望在新《预算法》实施的背景下对政府债务融资成本、规模的变化研究有所贡献。论文的研究主题是探究新《预算法》的正式实行对于低财政透明度省份城投债融资成本及规模的影响。研究结果将有助于完善财政透明度及新《预算法》影响的理论研
学位
2018年4月27日,《关于规范金融机构资产管理业务的指导意见》正式发布,资管行业以往的经营模式迎来了深刻调整。本文选择商业银行作为观察对象,探讨在资产新规出台前后,同业拆借市场与债券市场间收益的关联性有无发生改变,又是向着什么方向改变;考虑到商业银行主体行为是两市互动的重要微观基础,那么究竟是哪个或哪些操作因素导致两市相关性有所调整,我们将在理论分析的基础上进一步对其机制进行检验。本文首先对商业
学位
自2013年以来,控股股东股权质押比例逐年攀升,截止2020年底,控股股东质押股数达到5538.37亿股,占总股本比值18.7%,未平仓总市值32574.38亿元,疑似跌至平仓线市值17750.17亿元。比起门槛高且流程繁琐的银行融资,股权质押门槛低并且流程简便,使得控股股东股权容易变现,帮助控股股东缓解资金紧张问题。但是股权质押收益与风险并存,控股股东股权质押会导致公司面临控制权转移风险和严重的
学位