基于金融文本的我国投资者情绪复合指标构建

来源 :上海外国语大学 | 被引量 : 0次 | 上传用户:Pinger605
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人类的行为方式通常受到各种因素的影响,其中情绪因素既是影响人类行为方式的因素,反过来也是人类行为的指示器。金融市场的正常运作与参与金融活动的各方行为主体密切相关。投资者作为投融资活动的主体,其行为方式时刻左右着金融市场的走向。为了更好的了解投资者的行为对金融市场的影响,投资者情绪成为了学界始终致力于研究的领域。情绪的主观性使得投资者情绪的量化一直是重要的研究议题。目前,更加准确有效的投资者情绪测度已经是目前研究的重要方向。投资者情绪测度方面的努力,一方面能够为投资者情绪与金融市场之间的关系研究提供更高质量的投资者情绪变量;另一方面从投资者实务的角度,也能够为投资者在收集市场信息的时候提供指导价值。信息传播的渠道在信息爆炸的时代也在爆炸性扩展。大到传统媒体转型的数字化渠道,小到社群里面的讨论。文本信息在这些传播渠道中部分信息会被重复传播,同时也会在每一个环节中添加一些新的信息,这导致了文本信息中存冗余和有效信心交织在一起。这一点对于具有口语化特点的社交文本来说更甚。因此,如何在剔除掉冗余的信息同时,尽可能多的去保留更多的有效信息是以金融文本为基础的投资者情绪研究需要关注的重点。本文使用的研究数据为金融文本数据。同时,基于不同来源金融文本在表达方式和语气上的差异为考量因素,选取了三大证券报、财经新闻网站和股票论坛三种不同维度的文本数据。本文的研究基于深度学习的文本分析方法,首先使用了基于谷歌原生BERT的国内首个中文金融预训练模型Fin BERT1.0,基于本文的研究内容进行模型微调后对文本数据进行情感分类;然后,使用PCA主成分分析方法构建出我国投资者情绪复合指标。复合指标的构建旨在剔除冗余信息和保留有效信息。再次,使用格兰杰因果检验对该指标进行合理性检验和线性回归对指标进行有效性检验。线性回归结果显示该指标与上证指数涨跌幅之间存在显著的正相关关系。可以得出该指标对市场趋势有较好的跟踪与指示作用。最后,探讨了在Python环境下根据构建好复合指标的前提下,设计出一套实时获取文本并转化成情绪指标的实时监测系统的可行性。不论是开源的深度模型的训练,还是Python编程语言的使用,都具有非常强的可推广性。
其他文献
DNA甲基化是人们最早观测到的表观遗传调控装置之一。最能够体现原核生物中DNA修饰的则是N6-甲基腺嘌呤(6mA),其最关键的作用发挥在限制-修饰系统中,在外来DNA入侵时保护自身DNA。近20年来的研究在真核生物,甚至包括哺乳动物和植物基因组中鉴定到了 N6-甲基腺嘌呤,并指出了其对于多细胞真核生物的基因调控,疾病免疫等方面的基础性作用。这些研究掀开了真核生物表观遗传修饰的新篇章。作为这一研究最
学位
20世纪末,城投平台伴随着政府投融资体制改革与分税制改革而出现。2008年,在4万亿投资拉动催化下,城投平台大规模兴起。20多年来,城投平台的发展推动了地方城市的繁荣。城投平台既是体制改革初期的必然产物,亦是我国经济发展中期饱受争议的基建投资者。在经济体制改革的不断深化与国企改革的进程持续推进下,在基本完成历史使命的当今,也应该重新找到属于自己的定位,充分发挥自身与政府之间的特殊联系,顺利实现向市
学位
传统的经典物理学与量子力学之间的诸多不同为许多理论的诞生提供了优秀的先天条件。其中贝尔非定域性作为量子力学标志性的理论成果,具备丰富的理论研究资源和思维启示价值。首先从EPR佯谬开始,本文阐明了经典物理思维框架下的局部隐藏变量模型的所需要具备的条件,并依此结合数学工具和物理意义,推导出具备平移不变性的隐藏变量模型的贝尔不等式形式。其次,多体问题一直是物理学中一个重要的领域,随着量子信息领域的发展,
学位
现金股利分红是投资者获取上市公司经营成果的重要手段之一。在投资者制定投资策略时,公司是否进行分红以及分红的形式往往会成为很多投资者重点考虑的因素。而不同的投资者对于上市公司现金股利发放的关注程度存在一定的差异。21世纪初以来,在我国资本项目尚未完全开放的大背景下,境外投资者开始逐步通过2003年正式实施的合格境外机构投资者机制以及后来的沪深港通等特殊的制度安排投资于中国境内资本市场。相较于A股市场
学位
随着第六代移动通信技术(6th Generation Mobile Networks,6G)的到来,无线通信数据量将呈现爆炸式增长,太赫兹技术成为提供这一超大容量的关键技术支撑。然而,考虑到太赫兹频段极大的路径损耗,需要利用大规模阵列天线系统提供波束增益用以抵消损耗。同时,随着阵列天线规模的不断增大,太赫兹频段波长的极小特性,使得太赫兹大规模阵列天线系统极易处在近场范围。近场通信呈现的球面波前特性
学位
互联网改变了人们与信息的互动方式,逐渐取代报纸、电视等传统媒体,成为人们获取信息的主要渠道。个人投资者在投资类论坛上的信息交流也可看作一个庞大而复杂的社会网络,这个信息流网络反过来又影响着每个用户预期的形成和投资决策过程。投资服务中心2020年的调查显示,在投资者获取信息的渠道中,网络新媒体占37.7%,而传统媒体仅占20%。在金融领域,投资社交平台如雪球、股吧、基金吧、韭圈等集投资和财经交流的平
学位
测序技术的不断发展带来了前所未有的测序速度和大规模的测序能力,生物学家们所需要处理的序列规模越来越大、类型越来越多,对自动化序列分析程序的要求也越来越高。多序列比对是生物序列处理过程中的基础性任务,其准确性将对后续的分析产生持续影响,再加上该问题本身的复杂性,致使越来越多的研究致力于使用不同的算法来满足生物学家们各种各样的需求。本文在实验室已有多序列比对软件HAlign的基础上,进行各种改进的尝试
学位
目的 观察针刺手足阳明经穴治疗桥本甲状腺炎的临床疗效。方法 纳入桥本甲状腺炎患者30例,取主穴:合谷(双侧)、曲池(双侧)、臂臑(双侧)、肩髃(双侧)、中脘、足三里(双侧)、人迎(双侧)、水突(双侧);阴虚火旺证加神门(双侧)、照海(双侧),肝郁脾虚证加太冲(双侧)、太白(双侧),脾肾阳虚证加关元、太溪(双侧),针刺得气后予平补平泻手法30 s,留针30 min,每周针刺3次,连续12周。伴甲状腺
期刊
结直肠癌是常见的恶性肿瘤之一,其发病率呈上升趋势,总体预后并不理想。多学科诊疗(MDT)模式是改善结直肠癌患者预后的有效方式。第一,MDT可以提高结直肠癌术前分期的准确性,而准确的术前分期是决定治疗策略的主要因素;第二,MDT在处理复杂临床问题方面有突出的优势。不同学科专家在MDT会议上对复杂临床问题进行讨论,有助于为患者制定更加精准个体化的治疗方案,减少治疗延误;第三,MDT模式有助于青年医生进
期刊
目的 探讨血清人附睾蛋白4(HE4)在结直肠癌中的诊断价值。方法 前瞻性选取中山大学附属第七医院2020年7月至2021年11月期间收治的104例结直肠癌患者为病例组,93例结直肠良性病变患者为良性病变组,纳入同期接受体检的106例健康个体为对照组,检测血清糖类抗原72-4(CA72-4)、糖类抗原19-9(CA19-9)、癌胚抗原(CEA)、HE4水平,以手术病理活检结果为金标准,采用受试者工作
期刊