基于随机分布嵌入方法的股票指数预测研究

来源 :中南财经政法大学 | 被引量 : 0次 | 上传用户:linmu22952
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
股票市场不仅能让投资者从中获利,还能够体现宏观经济的信息,所以无数的投资者和研究学者都在不断探索如何更加精准地捕捉股票序列中蕴含的信息,用来对股票序列进行预测,无数学者的研究证明了将机器学习模型应用到股票市场上相比传统的统计学方法能够获得更高的精确率,因此机器学习模型已然成为股票市场领域的重要研究工具。中国股票序列波动较大,预测也相对比较困难。前人对股票序列的预测做过很多工作,本论文选择上证50指数作为目标变量,在前人研究的基础上创新地使用随机分布嵌入(RDE)方法进行预测,RDE方法适用于处理极高维短期数据,不同于以往的研究,本文实证研究中只利用股票价格序列数据,而不需要场外信息。本文从国泰安数据库获取2018和2019年两年共487个交易日的股票价格序列数据,对所得数据进行预处理,删除缺失率高的变量,对剩余的股票序列填补空缺值,再进行标准化,得到3319个处理后的股票序列数据。首先,本文在实证中通过步长为1的滚动预测方式进行多步预测以及确定RMSE、MSE、MAE作为模型评价指标;然后,基于3319个处理后的股票序列通过RDE框架结合高斯过程模型得到上证50指数预测序列。类似地,基于样本时间周期内上证50指数的67支成分股通过SVM模型对上证50指数进行预测,分析比较模型拟合效果。从实证结果能够得出,在本文的研究环境下通过RDE框架下结合高斯过程模型得到的上证指数预测序列拟合效果明显优于通过SVM方法得到的指数预测序列。再然后对RDE预测股票序列方法做进一步探索,一是通过RDE方法预测两支个股,找出对目标变量预测起作用最大的十支股票,挖掘股票间相关性;二是基于得到的上证50指数预测序列通过EG策略进行投资,最终的累计收益超过基准策略(买入持有策略),进一步证明了RDE方法在股票市场上是有效的。通过实证过程可以看出,面对高维短期数据比如本文研究中的3319个变量、487个日交易数据,RDE方法仍然能够游刃有余地进行处理,此时一般其他的降维方法和机器学习模型都会失灵。最后,对前文的研究工作进行总结,并提出可能的改进方向:一、使用其他机器学习模型替换掉本文实证研究中的高斯过程模型以期在性能和时效上有更好的效果。二、尝试在RDE框架下使用混合函数代替单一函数。三、将挖掘与目标变量相关性强的其他股票部分做成一个完整的可视化系统。
其他文献
随着中国社会经济的不断高速发展,我国目前机动车保有量快速增长,这一方面见证了中国社会经济的发展,人民生活水平的提高,另一方面也对城市道路的通行能力提出了更高的挑战,城市交通状况不断恶化。虽然各个城市的道路交通基础设施在不断完善,各种交通出行政策不断发布,但是交通拥堵情况仍不容乐观。交通拥堵问题是各个城市面临的难题之一,也是城市发展过程中需要解决的重大问题。移动互联网时代的到来让所有的移动端设备都能
学位
经济的高速发展带来资金的频繁流动,随着社会需求和消费观念的转变,信用贷款成为当前人们解决资金周转问题的首选方式。随着需求的不断增加和我国信用体系的不断完善,海量数据带来维数灾难以及特征繁多等问题,给贷款违约预测带来新的挑战。因此将集成学习技术应用于贷款辅助决策具有一定的理论研究价值和现实需求意义。本文基于特征工程和多视图学习结合集成学习技术,对实际贷款数据进行建模分析,设计并实现了基于集成模型的贷
学位
如今电子病历是医院信息化的产物,这其中包含有大量的临床知识和医疗信息,常常被用来做临床诊断以及药物推荐等,因此利用自然语言处理来挖掘医疗文本中的信息成为了一个重要的研究课题。在一领域中,命名实体识别被广泛地应用,它可以用来提取医疗文本中的各类实体,关系抽取作为其下游任务,可以用来抽取出实体之间的关系。在实际生活中,人们也逐渐关注到电子病历结构化系统,将传统的非结构化文本转化为结构化数据,便于医生更
学位
2020年,我国最高人民法院和武汉市中级人民法院接连在标准必要专利诉讼中依据知识产权行为保全制度,实质上签发“禁诉令”,表明了我国建立标准必要专利诉讼禁诉令制度的现实需要。我国尚未建立禁诉令制度,面对我国当事人申请签发禁诉令的需求,我国法院只能通过适用知识产权行为保全制度来应对,但是知识产权行为保全制度并不能与禁诉令划等号,二者的理论基础、适用条件存在着极大的差异,并且其与国际上的禁诉令制度无法完
学位
传统理论一般认为,反垄断争议是具有公法性质的争议,是国家司法领域的故有领地,必须通过法院进行裁判,不可以通过仲裁方式进行解决。党的十八大以来,国家加大了对反垄断的执法力度以及相关行业的整治,反垄断争议层出不穷,且案件数量持续增长。尽管现行争议解决机制在一定程度上发挥着重要作用,但因其自身具有的局限性导致无法发挥最大作用,例如反垄断争议行政执行解决方式无法克服行政执法机构地位边缘化、执法手段单一、执
学位
高新技术产业,是国民经济体系中不可或缺的产业,是我国经济发展的重要倚靠,具有广阔的发展前景。十九大汇报中指出我国要到二〇三五年步入创新型大国队列,高新技术产业成为建立社会主义创新型大国进程中的关键主体,它的发展关乎着国家创新发展。高新技术产业创新绩效的高低代表着产业发展水平,故,研究高新技术产业创新绩效有着重要的价值。同时,近年来,国家大力发展数字经济,“数字经济”这一概念在理论和实践中都被广泛使
学位
2022年3月国家互联网信息办公室等四部门联合发布了《互联网信息服务算法推荐管理规定》,指出推荐算法需要对个人信息依法予以保密,不得泄露或非法向他人提供。推荐系统为用户在海量数据中提供精准的选择,但在这个过程中会收集到大量的用户信息。一方面,推荐模型需要大量的有效用户标注数据来进行模型的训练,推荐系统的准确度和个性化程度都与其掌握的个人信息成正比。另一方面从个人信息保护的角度来说,将个人数据上传到
学位
随着全球地理信息技术的发展,地形数字化已经影响到了各行各业。而数字高程模型(Digital Elevation Model,简称DEM)作为一种基础地学模型,不仅能实现地形的数字化模拟,更影响着一系列基于DEM的基础地学实验。但是,就现阶段而言,高质量的DEM很难获得,因为这个过程十分的耗时而且昂贵,并且高精度数据的获取也十分受到限制。但是,如果使用机器学习技术解决这个问题,就可以低成本、高效地生
学位
异步审理模式为我国首创,并经三大互联网法院积累了大量的实践经验,取得了突出的实践效果,在很大程度上节约诉讼成本,提高诉讼效率。但截至目前,除最高人民法院颁布的《人民法院在线诉讼规则》之外,尚无其他法律法规做出相关回应,实践中也存在很多问题,亟待进一步解决。本文试图以互联网异步审理的基本问题分析为基础,围绕互联网异步审理的理论与实践进行研究。“异步审理”是指经各方当事人同意,人民法院可以指定当事人在
学位
在互联网高速发展的今天,游戏产业也顺势发展,现已经成为了用户规模巨大,经济增长极快的行业。截至2021年1月,中国游戏用户规模达到了6.65亿人,游戏收入方面,去年全年中国游戏市场实际销售收入2786.87亿元,而距今为止最为突出的移动端游戏当属游戏《原神》,上线6个月后仅仅在移动端就从全球获取到超过10亿美元的营收,可以说是创造了移动端游戏的奇迹,随着游戏刚开服的新鲜感已过,如何实现游戏的长久发
学位