股票预测模型数据挖掘

来源 :科学与财富 | 被引量 : 0次 | 上传用户:zhengwwwchao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:大数据挖掘是当今各方面研究的一个趋势,随着人们生活水平的提高,股票被越来越多的人当做投资工具,但众所周知,股票具有高风险的特性,本文利用已有数据通过实证研究来预测股票未来的买入情况。
  关键字:大数据,股票,预测
  一、 背景介绍
  股票是一种有价证券, 是股份公司在筹集资本时向出资人公开或私下发行的、用 以证明出资人的股本身份和权利,并根据持有人所持有的股份数享有权益和承担 义务的凭证。股票代表着其持有人(股东)对股份公司的所有权,每一股同类型 股票所代表的公司所有权是相等的,即“同股同权”。股票可以公开上市,也可以 不上市。在股票市场上,股票也是投资和投机的对象。对股票的某些投机炒作行 为,例如无货沽空,可以造成金融市场的动荡。
  开盘价又称开市价,是指某种证券在证券交易所每个交易日开市后的第一笔 买卖成交价格。世界上大多数证券交易所都采用成交额最大原则来确定开盘价。
  收盘价是指某种证券在证券交易所一天交易活动结束前最后一笔交易的成 交价格。如当日没有成交,则采用最近一次的成交价格作为收盘价,因为收盘价 是当日行情的标准,又是下一个交易日开盘价的依据,可据以预测未来证券市场 行情;所以投资者对行情分析时,一般采用收盘价作为计算依据。
  最高价指某种证券在每个交易日从开始到收市的交易过程中所产生的最高价。
  最低价指某种证券在每个交易日从开始到收市的交易过程中所产生的最低价。
  成交量是指一个时间单位内对某项交易成交的数量。一般情况下,成交量大 且价格上涨的股票,趋势向好。成交量持续低迷时,一般出现在熊市或股票整理 阶段,市场交投不活跃。成交量是判断股票走势的重要依据,对分析主力行为提 供了重要的依据。
  K 线图这种图表源处于日本德川幕府时代(1603~1867 年),被当时日本米 市的商人用来记录米市的行情与价格波动,后因其细腻独到的标画方式而被引入 到股市及期货市场。通过 K 线图,我们能够把每日或某一周期的市况现完全记录 下来,股价经过一段时间的盘档后,在图上即形成一种特殊区域或形态,不同的 形态显示出不同意义。插入线、抱线和利好刺激线这三种 K 线组合是最常见的经 典见底形态。
  二、 数据处理
  数据挖掘(Data Mining)是從大量的、不完全的、有噪声的、模糊的、随机的 数据中提取隐含在其中的、人们事先不知道的、但又是潜在有用的信息和知识的 过程。随着信息 技术的高速发展,人们积累的数据量急剧增长,动辄以TB计, 如何从海量的数据中提取有用的知识成为当务之急。数据挖掘就是为顺应这种需 要应运而生发展起来的数据处理技术。是知识发现(Knowledge Discovery in Database)的关键步骤。
  三、 数据分析
  根据上述的日线信息,可计算出该股票在7日、14日、28日和56日,不同时间段内的统计信息,如下表所示。
  表2:预测日前的各时间段统计信息
  根据上述各时间段的统计信息,可根据模型的计算规则,并将结果归一化后分别计算出6个神经网络的输入变量。将输入变量代入神经网络中经过计算,可得到神经网络的输出变量。
  四、 分析结论
  根据各神经网络的输出变量值,可按照预测得分的计算规则得到最终的预测得分为60.048。由于该股票在2016年8月3日收盘后发出买入信号,参照2016年8月3日后28天内的日线信息,发出买入信号后的第13个自然日时,最大累计涨幅达到28.99%,符合最大涨幅超过5%的预期。
  本模型中的各神经网络在训练时将误差可接受的范围设置为0.1%。在2006年1月至2016年1月的训练样本中工发出买入信号10050次,其中有8427次在发出买入信号起28天内出现5%以上的涨幅,准确率为83.85%。训练结果如下表所示。
  在2016年2月至2017年1月的测试样本中共发出买入信号18934次,其中有17631次在发出买入信号起28天内出现5%以上的涨幅,准确率为93.12%。测试结果如下表所示。
  作者简介:张琪琪(1991—),女,山西临汾人,山西财经大学2015(财政学)学术硕士研究生,研究方向:财政理论与政策.
其他文献
摘 要:随着社会生活水平不断进步,科学技术不断创新,在档案信息的管理工作中,开始引入了先进的现代化技术,利用现代化手段实现的电子档案相比于传统档案,具有绝对的先天优势,帮助档案快速完成了信息化建设进程。电子档案和传统档案比拥有更大的容量,并且能够跨越时间和空间的限制,能够实时更新。虽然有着诸多优点,但是其中也存在着一些较为常见的安全问题,所以想要更好的建设现代化电子档案,就需要加强安全保障体系的建
期刊
摘要:科技是第一生产力,从长期来看,推动一个国家进步的重要因素之一就是科学技术,而中小企业作为我国经济的中坚力量,他们的技术水平是十分重要的,而技术想要进步,研发支出的强度是必须提高的,本文就影响中小企业研发支出的因素做了分析,就其结果显现的问题提出了对应的政策建议。  关键词:研发支出规模,影响因素,研发支出强度,政府优惠政策  一、引言  有关部门提供的信息表明,我国中小企业对国民经济的贡献率
期刊
摘要:本文运用安全系统工程的理论和方法,将风险管理理念引入索道运营管理中。运用风险识别、风险评价的流程方法,找出索道运行及维护中存在的风险,并对各种风险及其危险程度进行评价,在此基础上,提出风险控制的具体措施。运用风险管理有利于控制或减少索道运营中存在的风险,防范事故发生,提高安全管理的精确度,促进决策的科学化。  关键词:索道;风险管理;风险识别;风险评价;风险控制。  一、风险管理理念的引入 
期刊
摘 要:经济社会的快速发展,带来的是人们物质生活水准的提升。如今,在物质需求不断被满足的前提下,人们越来越注重可持续发展,环保成为人们关注的重点和热点,所有能产生环保效应的项目如共享单车、新能源汽车等都受到人们的欢迎。然而,随着城市化进程的发展加快,暖通空调成为大型商场、写字楼等的标配。这些暖通空调在给我们的生活带来便利的同时,也因其高能耗给环境带来一定的危害。在这一背景下,暖通空调的节能环保技术
期刊
摘 要:文章从四川盆地川西坳陷峨眉山玄武岩的岩性、岩相和储层特征入手,分析峨眉山玄武岩孔隙、裂缝等储集空间的形成分布规律。其岩性主要为玄武岩,火山角砾岩和凝灰岩、辉绿岩;岩相分为溢流相、爆发相和侵入相;其储集空间主要是原生气孔、溶蚀孔洞和裂缝;凝灰岩、角砾岩和裂缝、孔洞较发育的气孔玄武岩是最好的储集岩类。  关键词:峨眉山 玄武岩 岩相 储层特征  Abstract: Based on the l
期刊
摘要:近些年来,随着我国城市现代化建设的不断深入,我国房地产行业获得了迅猛的发展,房地产调控所面临的问题也发生了一定的改变。本文首先分析了影响我国房地产调控效果的主要因素,在此基础上提出了改善房地产调控效果的有效对策以供参考。  关键词:房地产调控;影響因素;对策  前言:房地产宏观调控的效果直接影响着房地产市场的稳定发展,根据当前阶段我国社会经济发展形势来看,只有采取堵疏结合的调控措施,才能将房
期刊
摘 要:当前,我国正在全面进入社会主义新时代,面临很多新问题和深刻变革。在这一时代背景下,追本溯源、探求马克思主义中国化思想的源流,对于指导今天的发展道路有着重要的现实意义,本文尝试从马克思主义发展道路出发,梳理马克思主义中国化的思想源流。  关键词:马克思主义中国化;东方社会;思想源流;  引言  在十九世纪五十年代,马克思开始关注并研究东方社会,提出了东方社会实现社会转型的相关理论;在这一基础
期刊
摘 要:经济快速发展的今天,互联网行业的发展也越来越迅速,随着互联网和智能终端的不断普及,共享经济成为当今社会的主要商业模式,得到了快速的发展。ofo共享单车成为共享经济中的主要典型,共享单车在高校中的运营模式作用互联网进行操作,为高校学生带来了出行的方便。但在给学生带来便利的同时,也存在着诸多问题,例如,定位不够精确、单车设备易损、缺少规范管理和安全隐患等问题,本文对高校共享单车的运营出现的问题
期刊
摘要:随着我国对于事业单位改革的不断深化,各事业单位都将主要的精力投入到单位的运营和绩效的取得上来,而对于本单位的政工工作有所忽视,造成政工工作开展不充分。但是,政工工作的开展程度与事业单位各项业务的开展具有密切的关系,不可将二者完全割裂开来。在新时期,应该不断总结影响事业单位政工工作顺利开展的影响因素,并对当前政工工作的开展现状进行细致分析,不断探索和改善其现状的应对措施与解决策略,不断促进事业
期刊
摘要:数学学习效率是指个人在有限的时间内通过对课本中相关概念与定理做到充分理解与把握,并在做题时提取有效已知条件进行建模分析,最后求解出答案的结果。数学学习效率高的高中学生,能够在平时的学习中对相关公式与定理进行有效理解,考试时快速提取有效信息,并通过分析找到解题思路,经过一系列的计算后得出正确答案。高中生高中数学成绩的提高必须提高学习效率,理解与融汇贯通相关知识,加快对有效信息的组织与提炼,在考
期刊