基于深度学习的不同信息渠道投资者情绪指标构建及其对股票预测能力研究

来源 :东华大学 | 被引量 : 0次 | 上传用户:wangfei871010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
20世纪80年代行为金融理论悄然兴起,传统的资本资产定价模型(CAPM)和有效市场假说(EMH)的权威地位开始受到动摇。行为金融理论认为,内在价值并不是决定市场价格的唯一因素,很大程度上投资者的心理与行为也在影响着市场价格的变化。相较于国外,中国股票市场的投资者构成比较复杂,并且投资者受到信息的来源广泛。来自不同渠道的信息影响着投资者对股票市场的期望和决策,造成股票市场的波动。因此,正确的度量投资者情绪不仅有助于监管部门对市场的监控,还能帮助投资者进行投资决策。迄今为止,许多学者开始注重于如何从文本数据中挖掘投资者情绪,从而建立投资者情绪指标。以往的研究中,在数据维度方面,往往只针对单一的信息渠道进行研究,但是投资者接收信息的渠道是多元的,随着互联网的发展产生的海量的文本数据,新闻,评论和研报文本都会对投资者产生不同的情绪引导;在文本情感分析方面,目前BERT模型在文本情感任务上取得不错的表现,但仍有提升空间,可以从训练方式和模型结构方面进一步优化构建适于金融文本的Fin-BERT模型来提升对文本的语义学习能力;在指标构建方面,现有研究没有考虑信息的影响程度和持续性特点,实际上不同渠道的信息对投资者的影响程度是不同的,并且可能在后续一段时间内影响着投资者的判断和决策。基于上述背景,本文综合考虑不同渠道的信息,使用新闻报道,股吧评论和研究报告分别度量宏观信息,散户投资者和专业机构对股票市场的投资者情绪,能够全面量化市场情绪。首先,针对新闻,评论和研报的特点,设计了特殊化的数据预处理方法,并建立了不同的情感分析模型。对于新闻和评论,构造了适合于金融文本的Fin-BERT情感分析模型;对于研报,采用语义规则模型提取文本情绪。然后,本文考虑了信息对投资者的影响程度和持续性,利用半衰期配权法结合文本阅读量和机构排名等信息,分别对新闻,评论和研报文本构建日度的投资者情绪指标。最后,为了探究本文所构建的投资者情绪指标的有效性,利用格兰杰因果检验从统计意义上验证了其与股票收益率之间的因果关系;并将投资者情绪指标作为输入因子使用LSTM模型探究了其对收益率的预测能力,结合DM检验从预测能力方面证明了基于多信息渠道的投资者情绪指标能够显著提高预测能力。
其他文献
目的 探究奥马珠单抗对支气管哮喘大鼠肺功能及气道重塑的影响,并分析可能的机制。方法将36只哮喘致敏性合格的大鼠随机分为模型组及低、中、高剂量组,每组9只,另取10只正常大鼠为对照组。除对照组外,其余各组大鼠均用卵白蛋白(OVA)致敏并雾化吸入法诱导大鼠支气管哮喘模型。其中低、中、高剂量组大鼠于模型复制成功后,分别腹腔注射83.16、166.32、332.64 mg/(kg·d)奥马珠单抗溶液,连续
期刊
背景 在中国,新生血管性年龄相关黄斑变性患者中约有40%患有多灶性脉络膜血管病变(polypoidal choroidal vasculopathy,PCV)。PCV会导致反复视网膜色素上皮脱离(pigment epithelium detachment, PED)、广泛的视网膜下或玻璃体内出血,以及严重的视力损失。近年来,已有多种该病的治疗方法在中国使用,临床医生需要获得治疗PCV的全面经验。方
期刊
信用贷款逐渐在人们的生活中普及,越来越多的人使用小贷,分期,信用卡等信贷服务来提升生活的质量。根据统计,消费类贷款余额从2016年末的24.6万亿增长到2021年底的53.3万亿。与此同时,不良贷款余额也在迅速增加。为降低金融机构的信用风险,保证行业的可持续发展,利用机器学习和人工智能技术降低逾期风险具有重要意义。本文以上海某金融科技公司在拉丁美洲的信用贷款交易数据为研究对象,利用Python工具
学位
在我国经济的高速发展下人民生活水平显著提高,促使了第二产业不断调整升级以满足日益膨胀的市场需求。同时,人们开始注重生活品质的提升,对于日常用品的质量也提出了更高标准的要求。由于第二产业在我国产业结构中占据十分重要的地位,在其日产量巨大的背景下,质量控制成为生产过程中不可或缺的一环,缺陷检测具有十分关键的实践意义。目前大部分企业采用的方式是人工目测,但这种方式存在检测效率低、精度失真、稳定性差、成本
学位
近年来,科学技术的进步推动了“互联网+政务服务”的发展,越来越多的政民互动平台进入到大众的视野。这些平台是政府和群众之间交流的重要桥梁,群众可以通过其表达心声,政府可以通过其了解民意、汇聚民智。然而,随着大数据时代的到来,政民互动平台上的留言数量也迅猛增长。如何对这些繁杂的文本数据进行快速分类,从而实现政府和群众之间信息的有效交互成了一个亟待解决的问题。本文以某省政民互动平台的部分真实留言为研究对
学位
目的雷公藤多苷属于中药雷公藤的脂溶性化合物之一,用于多种免疫性疾病的治疗,尤其是狼疮性肾炎(Lupus Nephritis,LN)。本实验使用串联质谱6-plex(Tandem Mass Tag 6-plex,TMT6-plex)标记联合液相色谱串联质谱技术,测定雷公藤多苷治疗前后的LN患者血清蛋白质表达,发现显著性差异蛋白质,并探索差异蛋白质的生物功能及相关信号转导途径。揭示显著性差异蛋白质与雷
学位
由于分位数回归的稳健性,复合分位数回归变得越来越流行。此外,经验证,无论误差项的分布如何,复合分位数回归的效率相较于最小二乘回归高70%。最近几年,复合分位数回归被广泛的运用到了单指标模型的研究中,它在许多科学领域都有广泛的应用,如生物统计学、经济学和金融计量经济学。此外,各领域都呈现数据规模呈指数级别增长的特点,对于超高维数据的情况,本文提出了带有惩罚项的复合分位数回归方法用于单指标模型的参数估
学位
随着我国经济的日益强盛,我国的机动车总数量也在逐年递增,这使得高速公路的压力越来越大。为了缓解人们出行需求的急切增长所导致的高速公路交通供给与需求的矛盾,智能交通系统(Intelligent Transportation Systems,ITS)研究与建设得到关注,其中,高速公路的行程时间预测是智能交通系统实施过程中必不可少的环节,能有效提高公众出行幸福指数。本文的基础数据集是来自广州市机场三元里
学位
由于新冠疫情对我国经济的冲击和破坏,党和政府相继出台了诸多政策帮助小微企业抗击疫情,其中就包括支持商业银行向小微企业提供贷款。为了保障和落实政策,中国银保监会和中国人民银行对商业银行的企业规模划型办法提出了更高的要求。而互联网银行作为新兴的银行形式,因其自身的独特原因在开展企业划型判定上面临着诸多困难。本学位论文选题于工作中的实际问题,在深入分析的基础上,提出了一套集合科学技术与金融场景为一体的小
学位
以色列是世界上导弹防御技术发展较快,也是较早实战部署导弹防御系统的国家之一,这与其长期处于复杂的地缘政治环境,以及美国构建全球反导系统的需要密不可分。多年来,以色列坚持走自主研发与引进相结合的道路,已初步建成一个相对较先进的国家导弹防御体系。文中总结了以色列国家导弹防御体系的发展历程,描述了以色列国家导弹防御体系的作战流程,分析了以色列国家导弹防御体系的作战能力,展望了以色列国家导弹防御体系的发展
期刊