基于量价与情感分析的股市预测技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:hblhzl_18
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
股市预测作为一项难度很大且富有意义的一项任务,一直被各界研究者所关注。在“有效市场假说”的大前提下,一个信息公开透明,价格走势可不受约束地随信息的披露而波动的股市是很难预测的。然而,在实际情况下,所有投资者不可能同时掌握相同的信息,尤其是在互联网高速发展的今天,网络信息庞杂混乱,不同的投资者处理信息的能力不同,面对如此大量的信息会产生对价格走势不同的看法。从这一观点切入,本文希望通过现有技术来尽可能多的分析可获取信息,从而尽可能准确地预测价格走势。目前股市市场主要存在结构化数据(量化数据)以及非结构化数据(文本数据),因此本文的研究主要从以下三个方向出发:量化预测、情感分析、量化与情感分析融合预测。量化预测是整个股市预测中最基础但也是最重要的一个任务,其本质是时间序列分析,已有的绝大部分工作都是基于规则或是统计学对价格序列进行建模,需要了解一定金融领域知识,然而不断变化的股市规律以及股市市场本身的复杂性使得这种分析方式十分困难且效果也不尽人意。因此本文提出了一个基于栈式自编码结合长短期记忆网络的时间序列预测模型,通过栈式自编码来自动构建特征,并通过长短期记忆网络来进行时间序列分析。结果显示此模型获得了良好的收益。情感分析在分析已有新闻文本的基础上,进一步引入情感信息来提升预测效果,本文使用层次化表示方法来对新闻文本信息进行建模,得到多文档级别的表示,再通过引入询问驱动的注意力机制来引入新闻文本中的情感信息,这样可以根据需要来从不同的角度来来引入情感信息,最终得到带有情感信息的多文档级别的表示,从而建模新闻文本与价格走势之间的隐含关系。结果表明引入情感信息可以进一步提升基于新闻文本的预测效果。量化与情感分析联合预测则是上述两个部分的融合,考虑量化数据的同时也引入新闻文本的情感信息。该部分首先将这两部分数据进行编码,得到对应的信息表示,再通过变分推断来得到隐式的特征向量,最后通过解码将包含了融合信息的特征向量映射到股价涨跌类别。实验结果表明通过融合多种信息可以更好的对股价走势进行预测,同时也体现出了本研究的可行性。
其他文献
随着人口流动的常态化和深入化,流动人口的社会融合成为当前我国具有基础性、关键性的社会问题,其重要性基于以下几个原因:一是流动人口群体数量庞大,总体规模已接近全国总人
期刊
科技日报讯(孙国根 记者王春)复旦大学医学神经生物学国家重点实验室、脑科学研究院教授赵冰樵带领研究团队首次发现,脑内一种名叫“caspase-3”的分子,一旦被激活,不仅在人的脑卒
报纸
由于同宿分支问题在广大学科中的应用性,近半个世纪以来,其研究获得了极大的发展(见参考文献)。其中同宿翻转的现象,即轨道翻转和倾斜翻转,从十几年前开始就已经成为了热点之一。因
2016年12月,习近平总书记在中央经济工作会议上提出要着力振兴实体经济,并强调:“既要推动战略性新兴产业蓬勃发展,也要用新技术、新业态全面改造提升传统产业”。河北作为传统产
学位
创新生态体系存在的根本目的,是实现经济的持续增长、人民的充分就业和生活水平的提高,以及获得核心竞争优势。作为我市改革开放和科技创新的最前沿,自创区应充分发挥政策先行先
会议
《澳大利亚金融评论报》12月16日文章,原题:美国的对华战略错误 华盛顿陷入了一种“中国欺骗”的论调,口口声声宣称中国违反了2001年底加入世界贸易组织时做出的以西方模式改变
会议
在营销实践中,企业之间围绕销售绩效的竞争愈加激烈,传统企业聚焦于单一营销竞争手段的模式越来越无法应对瞬息万变的营销环境,为取得竞争优势,企业必须采取更加综合的、多样
什么是慢性萎缩性胃炎?$$    慢性萎缩性胃炎是慢性胃炎的一种,以局限性或广泛性的胃粘膜固有腺体萎缩(数量减少,功能降低)为主要病理特征,常伴有不同类型的肠上皮化生(肠化)或不
期刊
四川大学文学与新闻学院博导赵振铎,被要求带“官员博士”,他则对官员说:“你官当得好好的,读什么博嘛。”有官儿指使秘书找赵老师要求读博,赵回绝道:“他(即那官员)某些方面不够条件
会议
20世纪80年代以来,随着科学技术的发展,电脑技术的突飞猛进增长,生产方式、生产工艺的改变,产品再生产循环逐渐缩短、产品更新周期的缩短,以及全球性竞争的加剧,大大改变了产品成本
学位