一种基于短评情感分析的个股走势预测方法

来源 :天津商业大学 | 被引量 : 0次 | 上传用户:liyinhao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在研究股票市场的波动情况时,除了综合分析影响股市的相关金融数据外,还可以借助于股评短文本数据加以考量。然而,由于受情感分析技术的限制,目前对股评文本数据分析主要是基于手工标注情感极性基础上再进行股市波动预测,存在时间长、成本高、利用股票实际数据不充分等方面的问题。基于此,本文提出了一种将股票历史数据与股评文本数据有机融合,通过建立股票涨跌“五极”情感分析模型与“专家”权重函数模型,对个股涨跌趋势进行预测的统计分析方法。首先,利用种子词典与情感倾向点互信息算法建立情感词典将股评情感标注为涨、中性和跌三个极性;在此基础上,对照股票历史数据中涨跌幅度大小的具体信息,提取股票文本数据的特征词并更新情感词典库,将三类情感进一步标注为粒度更细的大涨、小涨、中性、小跌与大跌五个极性,再利用完成标注的股评数据训练分类器模型,实现对新的股评的五极情感分类。其次,利用每支股票下的评论者所对应的评论分类结果、每位评论者的分类预测准确率以及分类结果频数,计算每个分类结果所占的百分比;根据分类预测准确率对评论者进行“典型排序”,选取评论者中的“专家”并对排序结果进行归一化,建立权重函数模型,计算每位“专家”在预测得分中的权重;再将分类结果所占比例与每位“专家”的权重结合,建立“专家”预测模型,计算“专家”对个股的预测得分与预测的准确率,并从纵横两个方面分析了不同“专家”在同一时段以及同一“专家”在不同时段,对个股预测准确率的变化趋势。最后,将情感极性分类结果与实际股票涨跌数据相结合,利用实证分析的方法,对构建“五极”情感分析模型与“专家”权重函数模型进行了检验。结果表明:“五极情感标注”的准确率大于75%,由此训练生成的分类器模型,其预测的准确率也超过了70%,而建立的“专家”权重函数模型预测的准确率在60%到100%之间波动,稳定在80%左右。论文构建的“五极”标注模型,一定程度上实现了情感标签的自动标注,有助于解决人工标注复杂繁琐的问题;构建的“专家”权重函数模型,对探索基于个股评论数据的股票价格涨跌趋势预测,不失为一种新的尝试,具有一定的创新性。
其他文献
为加强个人信息保护和充分利用,我国制定了《个人信息保护法》并已于2021年11月1日开始实施。该法第69条将个人信息处理侵权的归责原则确立为过错推定责任,其进步意义无疑是值得肯定的。不过,对于个人信息处理侵权归责原则的设置问题各界仍没有达成共识。可以预见,随着个保法的实施,对于该问题的研究仍会是个人信息领域关注的焦点。因此,深入研究域外个人信息处理侵权归责原则的立法和实践,结合我国最新立法和实践探
学位
为了防治地下水污染,需要对污染物在多孔介质中的迁移做出预测。多孔介质关于污染物的吸附与解吸附作用影响了污染物的整体迁移规律,准确的吸附-解吸附模型将更有利于污染物迁移预测。本文通过对各类吸附模型的研究,验证了考虑吸附历史的非线性吸附模型(Bai模型)更符合实际情况,该模型考虑了多孔介质吸附能力的衰减现象,利用COMSOL Multiphysics(5.4)软件完成了数值模型的建立。通过理论分析与数
学位
当前我国的土壤污染问题日渐显著,为提高土壤质量需要对污染如土壤进行治理,而贝壳粉作为一种小粒径、碱性的材料,可以用作治理重金属污染物的吸附材料。本文研究了贝壳粉对重金属离子的吸附能力和吸附机理,同时分析贝壳粉在处理红土、石英砂中重金属污染物时渗流速度、重金属种类、贝壳粉添加量/浓度等因素对于吸附效果的影响。通过吸附动力学试验、吸附-解吸试验、微观电镜扫描、傅里叶变换红外光谱测试等手段对贝壳粉吸附镉
学位
《民法典》确立公序良俗原则,意味着既确认“习惯”“公序良俗”为民事法源,又确认“公序良俗”为习惯法源的是非标准,这一进步的历史意义在于承认民间社会生活自发生成的规矩秩序为民事补充法源,承认人民大众有集体无意识参与民事法源创制的权利。这既是从苏维埃法制理念向当代世界法治理念的升华,也是回归中华人文价值暨世界共同价值的升华。这一进步意义可以从公序良俗作为习惯法源之“宪法”、确立公序良俗原则的政治变革意
期刊
<正>2月17日,按照党中央和省委统一安排部署,山西省国资委党委召开2022年度民主生活会,会议以全面贯彻习近平新时代中国特色社会主义思想,深刻领悟“两个确立”的决定性意义,增强“四个意识”、坚定“四个自信”、做到“两个维护”,团结带领党员干部群众以奋发有为的精神贯彻落实党的二十大作出的重大决策部署为主题,
期刊
<正>风景园林建筑设计一直都是城市建筑设计的重点,将传统版画元素应用于风景园林建筑设计不仅能提升建筑物的魅力,而且有助于改善城市形象,促进当地旅游行业发展,进而带动经济发展。而版画是绘画的一种,讲究用刀或者化学物品在木板、石板等物品上进行雕刻或者蚀刻,以此创造出具有高度审美性的艺术作品。《传统文化语境下风景园林建筑设计的传承与创新》是由黄维著,东北师范大学出版社出版的书籍。该书从传统文化的角度出发
期刊
随着社会的发展和人们对生态环境和文化传承的关注逐渐增加,地域乡土植物在风景园林景观设计中的应用得到了广泛关注。越来越多的景观设计师在设计过程中开始注重选用本地乡土植物,将其融入景观中,以实现生态友好、文化传承和景观可持续性的目标。在风景园林景观设计中,充分应用地域乡土植物不仅能够融入当地自然环境,还能够体现地域特色,增强景观的可持续性和可塑性。本文主要探讨地域乡土植物在风景园林景观设计的应用方法。
期刊
随着非线性混沌理论描述现实经济现象的广泛应用,学者们认为非线性经济动态分析要优于均衡动态分析。因此经济活动的非线性相互作用在经济建模中得到重视,通过充分利用非线性动力学的混沌理论与方法,对经济系统的动态行为进行分析,非线性经济学由此得到发展。对于某一经济系统而言,稳定性可作为判断其优劣的标准之一。然而在经济领域中,当系统处于不稳定状态时,可能会导致混沌发生,这对多数系统而言是有害的。因此,如何控制
学位
蚁群算法在配电网故障区段定位中应用效果良好,但具有搜索时间长、计算速度慢等缺点,为此对蚁群算法进行了改进。首先构造了动态适应配电网拓扑结构的开关函数,其次提出了蚁群信息素初值设置方法,引入解的扰动规则,最后确定了蚁群算法应用于多电源条件下配电网故障区段定位的方法。算例结果验证了该算法在计算速度和容错性方面的优势。
期刊
麦肯锡讲过:“数据,已经渗透到当今每一个行业和业务职能领域,成为重要的生产因素。”数据信息是否完备和充足直接关系到行业及业务的发展,可靠、准确、完整的数据能够提供准确、及时和系统的统计分析与决策,反之,数据的不完整或缺失会降低统计分析与决策的准确性,影响行业和产业发展,甚至会造成巨大的经济和社会损失。然而,在生产实践中,由于某些主、客观原因,不可避免的会造成一些数据缺失,影响数据的质量。对于缺失数
学位