股票预测中的文本大数据挖掘研究

被引量 : 0次 | 上传用户:honghuishupian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代,数据蕴含的价值受到各个领域的广泛关注。从海量的非结构化文本数据中挖掘其潜在的价值,成为大数据处理技术研究的主要动力。随着移动互联技术的发展,网络数据量以指数趋势增加。投资者随时可以通过网络交流投资经验。为了挖掘投资者情绪,辅助投资者进行科学决策、有效投资,本文结合具体应用需求,从文本大数据处理系统架构设计角度出发,研究了支撑其实现的相关模型与关键技术,最终设计并实现了支持文本大数据处理的股票预测系统。论文主要的工作内容如下:1)系统架构的设计和关键技术的研究。首先,研究了大数据采集技术、大数据存储技术及大数据挖掘技术。其次,通过与传统文本挖掘方式相比,优化了数据采集和文本分类流程,降低了算法复杂度和挖掘过程中的数据量。最后,通过文本大数据系统架构设计及处理流程归纳出支撑其架构实现的关键技术。2)减少了无关数据的采集。本文研究基于股票本体的主题爬虫主要通过构建股票本体,计算网页主题相关度,指导爬虫对主题相关度高的网页进行优先爬取,减少无关数据的采集。3)设计了多数据源股票预测模型。本文利用大数据处理技术从文本中挖掘投资者情绪,用于投资者情感指数计算。分析影响股票价格的因素,提取影响较大的特征作为主成分,结合支持向量机在处理函数回归问题方面的优越性,设计了多数据源股票预测模型,并经实验对模型的有效性进行了验证。本文通过大数据处理技术挖掘投资者情绪,并对影响股票价格的多种因素进行分析,建立了多数据源股票预测模型,以此模型为原型实现了股票趋势预测系统。
其他文献
目的探讨黄芪注射液减轻缺氧缺糖/复氧复糖大鼠海马神经元凋亡的作用机制。方法取体外无血清原代培养8 d的大鼠海马神经元,采用随机数表法分为A组:正常对照组、B组:模型组(缺
知识产权保险是迎合市场防范与减少知识产权风险的要求而产生的一种新型的综合性保险,在我国应当尽快建立一套符合国内具体发展情况又能和国际接轨的知识产权保险制度,当前国
<正>宝岛美食品种多样天然食材营养丰富有点味豆花(又名豆腐脑)——一种历史悠久的中国传统美食,有点味豆花,源自台湾,作为豆腐脑的进化产品,口感、味道和品种独具特色,适合
大思政格局赋予了高职艺术设计专业教师新的时代责任和使命,一线专任教师必须提高自身思政理念,结合专业课程特点,挖掘课程思政元素,精心设计教学单元,推动高职艺术设计专业
在对无人机系统组成和关键技术进行概述和梳理的基础上,对民用无人机全球和国内的专利申请情况进行了检索和分析,对无人机中动力系统、飞控导航、机体平台和云台等关键技术和
伏立康唑用于治疗真菌感染,最常见的不良反应包括视觉障碍、神经功能障碍及肝、肾功能异常等。本文报告1例伏立康唑致视觉障碍患者,分析不良反应发生的原因及处理措施。
《数学课程标准》明确指出:“教师作为学生学习活动的组织者,要选择恰当的教学方式,因势利导,适时调控,努力营造师生互动、生生互动的生动活泼的课堂氛围,形成有效的学习活动。”课
随着世界经济发展,企业面临的市场环境发生了巨大的变化:市场竞争愈加激烈;消费者要求越来越个性化;市场对产品和服务提供的时间要求日益提高,企业必须快速满足消费者个性化的要
本论文依托于肖长来教授的项目《黑龙江省鸡东县水资源信息管理系统的建立》(编号3K105D974425)而选题的。本文阐述了水资源信息管理系统国内外研究现状,设计了系统功能结构,
在当前研究消费结构的作品中,许多作者研究的是对消费结构的定义,分析消费结构的影响因素,或者是研究和深入分析消费结构的主要特点以及如何使消费结构合理化等。也有许多作