【摘 要】
:
互联网的快速发展,使我国股民投资者更加热衷于在论坛中交流投资心得,由此产生的股评文本信息也成为影响股市健康发展的因素。近年来文本挖掘技术的兴起和成熟,使得通过挖掘股评文本数据实现对投资者相关的研究成为可能。本文以股吧为切入点,通过深度学习和机器学习方法实现了股评情感倾向性分类和识别感性投资者,并进一步研究了舆情与股市之间的相互关系。本文利用爬虫技术在东方财富股吧中获取所需数据,数据预处理后,使用W
论文部分内容阅读
互联网的快速发展,使我国股民投资者更加热衷于在论坛中交流投资心得,由此产生的股评文本信息也成为影响股市健康发展的因素。近年来文本挖掘技术的兴起和成熟,使得通过挖掘股评文本数据实现对投资者相关的研究成为可能。本文以股吧为切入点,通过深度学习和机器学习方法实现了股评情感倾向性分类和识别感性投资者,并进一步研究了舆情与股市之间的相互关系。本文利用爬虫技术在东方财富股吧中获取所需数据,数据预处理后,使用Word2Vec方法实现文本数据的量化表示。在建立股吧情感词典过程中,利用目前已有的情感词典,实现自动标注
其他文献
目的:系统整理、归纳并阐释吴鞠通《温病条辨》辛味药应用特点,揭示其在温病中的配伍应用规律,并为中医临证实践提供借鉴。 方法:本文基于四气五味理论,采用数据挖掘及理论探讨相结合的研究方法,结合吴鞠通对于药物性味的认识,运用SPSS统计软件建立数据库,对《温病条辨》中涉及辛味的方、药进行药物频数分析、性味归经分析以及三焦用药比例分析等,以揭示吴鞠通运用辛味的临证用药规律。 结果:数据分析:收集整理
中国的教育市场不断发展,特别是在线教育行业,但在发展过程中机遇伴随着挑战并存,特别是一些提供付费课程的平台,平台课程众多,还有其他平台竞争,如何留住学习者是平台健康发展的关键所在。每个平台都在关心什么课程能吸引学习者为此付费,学习者再付费时通常会考虑什么?基于此,本文研究了课程信息的哪些变量会影响课程的销量,并对一些课程的销量进行了预测。文章以IMOOC平台为例,与以往通过问卷调查获取样本不同,本
近年来,互联网经济发展迅速,“互联网+”模式成为发展潮流。诸多传统行业为了获取互联网经济发展的红利,都在此基础上创新,许多新的商业模式也应运而生。在此大背景下,“互联网+教育”模式出现,在线教育企业如雨后春笋般迅猛发展。随着在线教育企业增多,在线教育企业的经济活动也爆发式增长,企业间的投资、并购、收购、重组等经济活动日益频繁。这就意味着,研究符合在线教育企业特征的企业价值评估方法是必要的。目前,虽
随着中国金融市场的腾飞,上市公司不断涌现,而外部环境竞争加剧导致上市公司面临更大的财务风险。上市公司的财务状况变化将直接影响投资者的利益以及公司未来发展,因此,建立一套有效的上市公司财务预警机制意义深远。就目前看来,国内外学者对上市公司财务预警的研究已经取得了一些突破,主要是运用机器学习的方法对财务数据建模,并且取得了良好的效果。随着自然语言处理技术的发展,越来越多学者开始对财经类文本进行分析,试
使用中文文本进行情感分析和收益预测一直以来是众多投资者和研究者关注的焦点,这一研究可以帮助投资者们根据文本信息有效识别可能对收益造成显著影响的事件,并规避投资中可能出现的风险。本文通过使用股票公告文本进行预处理,建立基于文档主题模型理论的情感分析模型,该情感分析模型是一种混合多项分布模型,在表现形式上采用的是文本向量表示法。和传统模型不同的是该模型的训练是有监督的,因此可以根据特定语境下对预测任务
企业破产预测由于其在金融决策中的重要作用,一直以来都是学术研究的重要课题。用于企业破产预测的传统统计模型主要有判别分析和逻辑回归等。这些模型有着较强的可解释性,但是在预测效果上无法进一步提升。而随着人工智能的发展,机器学习和深度学习模型凭借其优秀的数据拟合能力以及抽象特征提取能力,开始受到研究学者们的广泛关注。但是在建立企业破产预测系统时,模型很少考虑到企业破产数据的不平衡性,从而导致在实际应用中
随着我国金融市场的快速发展,不断建立健全的金融产品和金融衍生品使我国经济更加繁荣丰富,但是由于不断波动的社会大环境,根据投资者需求而量身定做的场外期权很难通过直接购买标准化的交易所期权实现风险对冲,造成了对冲方法的局限性,但是金融机构可以通过各类金融工具和现货市场,运用delta对冲策略,进行期权复制操作,达到控制期权组合风险的目的。本文的研究主要由理论、模型构建和基于实际价格的模拟验证和实证分析
大数据时代的到来产生了许多的高维数据,使用张量对数据进行表示,能够保留数据的结构信息,因此近些年在现代科学和商业应用等领域得到了广泛的应用。随着张量数据变得越来越普遍,对可靠的张量数据分析方法的需求也越来越迫切。本文主要从聚类和回归两个方面分析张量数据。详细介绍了三种张量聚类算法:基于张量分解的CP+k-means和Tucker+k-means以及张量块模型,后者可以被视为k-means算法的高阶