基于深度学习方法的股票论坛挖掘分析

来源 :北方工业大学 | 被引量 : 0次 | 上传用户:zzz999z
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
股票市场通常以其高收益性的特点而收到广大投资者们的青睐,但云诡波谲的变化性也让股民朋友难以捉摸,因此难免引起投资者的不安情绪。在互联网金融快速发展的时代,股票论坛应运而生,正逐渐成为投资者们交流炒股经验的重要平台。伴随着深度学习方法的发展,利用自然语言处理工具的情感分析、文本分类等方法已成为目前热门的论坛数据分析方向。本文通过研究相关文献资料了解到,股票论坛内部活跃着大量真实投资者,其情绪变化反映着股吧论坛的各支股票的股民操作风向,如果能够及时获知投资者情绪信息,可为政府监管部门、市场中介机构、上市公司、投资者等主体提供决策参考,促进我国股票市场健康发展。为深度挖掘股票市场的内在变化,且准确度量金融论坛的社区主题,本文选取东方财富网股吧论坛作为研究对象,通过python3.7对东方财富网旗下股吧论坛中七支行业板块龙头股票发帖数据进行爬取,确定房地产板块的万科A吧(000002)、机械板块的三一重工吧(600031)、酿酒板块的舍得酒业吧(600702)、煤炭板块的陕西黑猫吧(601015)四支股票论坛作为通用模型采集对象,医疗板块的恒瑞医药(600276)、银行板块的工商银行(601398)、教育板块的中公教育(002607)作为优化模型采集对象,对文本数据进行清洗,结合网络论坛理论研究提出投资者情绪五分类IS-5,将文本情绪分为激进搏杀、积极乐观、中立谨慎、消极悲观、愤怒绝望五个类别,按照模型构建要求进行人工标注,共标注12893条数据。为了构建优质的股票论坛投资者情绪分类模型,本文应用深度学习的自然语言处理模型,以大量已标注的数据集为依据,选择目前文本分类任务中性能突出的BERT、ERNIE、Bi LSTM以及Bi LSTM+Attention模型进行性能对比,最终通过比对评价指标,选择更加成熟稳定的BERT文本分类器,作为股票论坛投资者情绪分类的通用模型。本文选择通过依次加入三支新的股吧行业板块数据,进行投资者情绪分类模型的重复迭代过程,达到减少加入样本量,降低训练时间的目的,形成泛化能力更强的股票论坛分类系统,东方财富网股吧论坛的投资者情绪分类模型得以搭建并优化。最后,在股票论坛场景下使用IS-5五分类雷达图进行可视化表示,并选择机械板块的安徽合力(600761)、酿酒板块的贵州茅台(600519)、银行板块的浦发银行(600000)三支具有鲜明特征的投资者情绪雷达图与当月股票价格进行对比,发现存在较大关联性,从而实现股票论坛投资者情绪分类应用。
其他文献
2,4-二氯苯酚(2,4-DCP)是一种致癌难降解的毒性氯化有机物,有效去除水环境中的2,4-DCP可保护自然生态系统。目前水体污染物处理多采用绿色环保、高效且低成本的技术。吸附法是一种操作简单、可重复再生使用、效率高、副污染小、连续性强的水处理方法,是水处理方法中的研究热点。因此,本文以葡萄糖为碳源,制备了Ni O@C6H12O6磁性花状石墨碳微球、硫氮掺杂Mo S2@C6H12O6花状颗粒、磁
学位
能源开发与利用是社会发展的永恒主题,热电材料是一种能将废热一步转化为电能的材料,柔性热电器件可通过诸如人体体表等曲面热源耗散的热量有效收集,并转化为电能,为可穿戴电子设备供电。本文选择化学气相沉积(CVD)法制备的柔性碳纳米管膜(CNTF)作为基础材料,通过对其进行改性,提升了材料本身热电性能,进而制备了可穿戴热电器件,并进行了实际应用,本次工作的具体内容和结论如下:(1)利用电化学与超声结合的方
学位
声源定位方法在日常生活、社会秩序维护、教育和营救领域中起着重要作用。目前,随着人工智能技术的发展,基于深度学习的声源定位方法的研究极为火热,该方法主要包括信号预处理、模型构建及其训练等核心步骤。本文对基于SELDnet的声源定位方法进行了研究,并结合了声音事件检测功能,对二者存在的难点进行了深入研究,主要研究内容可以总结为以下几点:(1)在声源定位方法中,因收集装置采集音频不可避免地收集了环境中的
学位
全球导航卫星系统凭借其高精度、全天候、操作简便等优点,已在地质灾害的长期稳定性分析和实时动态监测中得到了越来越广泛的应用。但是由于遮挡、多径和电磁干扰等因素影响,卫星信号质量会比较差,传统的标量跟踪算法会经常出现失锁,定位结果的精度无法保证。本文将改进GPS信号矢量跟踪算法,并采用信号模拟器产生仿真数据,进行实验验证。主要研究内容如下:(1)根据矢量跟踪环路算法流程搭建产生、采集和处理GPS信号的
学位
大数据时代,在数字技术迅猛发展的深刻影响下,数字贸易这一新的贸易形态兴起,正在改变国际贸易的格局。数字贸易的出现为国际贸易的发展带来了新机遇,同时也对贸易规则带来了不小的挑战,譬如数字贸易国际规则制定中的价值冲突问题。当前国际贸易以贸易自由化为发展宗旨,在数字贸易背景下贸易自由化意味着数据的跨境自由流动,但数据不只有经济价值,国家安全和个人隐私等也是数据贸易规则制定中不得不考虑的价值。为保护国家安
学位
无障碍环境建设是我国“十四五”规划(2021-2025)中加快社会建设步伐、全面提升城市品质、保障残疾人基本权益的重要内容。笔者近年参与“科技冬奥”重点专项课题《冬奥和冬残奥场所人员疏导技术与残障人群协助系统》,在残障人群疏散领域进行了专门的学习和研究。本文聚焦于北京冬奥场馆内残障人群疏散布局问题,运用可视化编程方法开发了一套编程模块,初步实现了疏散布局设计的生成和校验。在研究过程中,笔者分析了一
学位
传统村落是农耕文明的精粹,是中华民族宝贵的历史文化遗产。随着城镇化进程的加快,村落文化却不断受到城市文明的冲击。如何保护好传统村落文化,使其与现代城市文明相伴,成为一个重要的研究课题。同时,许多郊区村落,由于人口结构及生产生活方式发生了较大变化,尤其是在当前疫情常态化的要求下,村落内部交往空间成为村民日常生活的重要场所。如何适应村民的行为变化需要,如何为人们改善村落内部交往空间环境,都显得尤为重要
学位
近年来由于对天然砂的大量开采,天然砂资源愈来愈少,寻找天然砂替代品成为较为急迫的问题,而机制砂的出现使得这一问题得到了较好的解决。现阶段对于机制砂自密实混凝土的研究大部分集中在配合比或材料性能的研究上,对于机制砂自密实混凝土应用于组合构件研究较少。本文通过试验对型钢-机制砂自密实混凝土栓钉连接件抗剪性能进行研究,并采用有限元方法对其进行了数值模拟分析。主要研究工作如下:1.考虑了栓钉高度、栓钉直径
学位
随着中国城市化的快速发展和社会的不断进步,大量的农村人口转移到城市当中。城市变为主要的居民聚居点,城市结构也越来越复杂,城市的各项功能和环境越来越受到城市居民关注,其中社区做为城市的重要组成部分之一,社区的室外气候环境(尤其是小气候)做为城市居民最基础的生存环境,越来越受到重视。《北京城市总体规划(2016-2035)》中明确指出完善城市空间和功能组织秩序,严格控制城市规模,促进中心城区老旧小区综
学位
在以往学过的概率论理论中,人们常说的随机变量往往是单点值随机变量,即其取值为单值,但在实际生活中,在对随机变量进行取值的时候,往往不一定是只取一个具体的数值,有时候取值的结果可能是由许多个数值组成的一个集合,称之为集值.甚至有些时候,无法用明确的数值来表示某种变量的取值,而是一个模糊数取值,即本文研究的模糊集值.在金融或者控制等领域中,仅仅用单点值随机变量对一个事件进行描述就会产生一定的局限.这时
学位