基于时间序列分类的大宗期货价格走势预测研究

来源 :华东交通大学 | 被引量 : 0次 | 上传用户:dai_dx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
当前是一个高度信息化的时代,数据在数量与维度上相较于以往都有了量级的飞跃。在大量的数据中,相当一部分都属于广义上的时间序列数据,即数据前后具有时间关系。对于时间序列的研究一直以来都是一项重要且具有挑战性的任务,随着时代的发展对于时间序列分析也从如气象数据预测、心电图分类等相对传统的研究,衍生出像文字翻译、情感分类等挑战性更强的分支领域。但随着技术的发展,更多有效的研究方法也陆续出现。在时间序列分类问题上,为了解决遇见的挑战,近年来已经有许多方法被提出。这些方法大多基于传统的机器学习技术,如决策树、支持向量机、随机森林等。然而,这些方法往往忽略了时间序列数据的时间相关性和趋势,从而导致模型性能不佳。最近,随着深度学习技术的发展,许多基于深度学习的时间序列分类方法也被提出,但可解释性差的弊端也日益凸显。本文归纳了对于时间序列分析的许多方法,从对时间序列分类可解释性与分类准确率两方面出发,构建了一个时间序列分类模型。该模型利用函数型数据分析和Shapelet方法对时间序列特征进行提取,再将提取出来的特征与原始数据合并,作为双向长短期记忆网络(Bidirectional Long Short-Term Memory Networks,Bi-LSTM)的输入,进行时间序列分类研究。本文使用了期货价格数据进行该模型效果的实证分析,并与其他现有的一些时间序列分类方法进行比较。本文的主要研究内容具体如下:(1)将期货价格预测利用涨跌幅值进行划分,从而将预测问题转换为分类问题。对于金融数据预测的研究,以往的研究常常对于未来走势的具体值进行逐一预测,这样的研究方式对于某些情况并不合适,本文通过这样的方式将目标更明确。(2)对时间序列数据特征进行提取。本文为考虑到模型的可解释性,采用了函数型数据分析和Shapelet方法对时间序列本身的全局特征以及具有区分性的局部特征进行了提取,得到了两种特征序列。函数型数据分析从样本角度出发,对每一条期货价格数据进行函数型主成分分析,将其全局特征抽象为很短的主成分得分数据向量;Shapelet方法从分类标签角度出发,对不同标签的数据所有片段进行分析,从中学习到有区分性的片段,作为此标签类型数据的局部特征。(3)使用Bi-LSTM对数据分类。使用包含时间序列全局特征和局部特征的数据进行分类。在模型构建上,使用Soft-max作为分类器,在训练中引入Dropout层,并采取了批量归一化、梯度裁剪和提前停止等方式来对过拟合的情况加以限制。本文构建的模型经过训练集训练后,在20%的测试集上精度为82%,加权平均召回率为82%,加权平均精确率为83%,加权平均F1得分为83%。(4)与其他时间序列分类模型对比。本文还使用了随机森林、CNN、Shapelet、LSTM和Bi-LSTM对原始的期货数据进行分类,得到分类结果后与本文构建的模型效果进行对比,发现本文构建的模型是在效果上优于其他模型,同时分类具有一定可解释性。
其他文献
《公司法修订草案》对现行公司法进行涉及七个方面的较大篇幅的增订、修改,但未能清晰地显现中国未来公司法的价值功能定位。中国到底需要一部分什么样的公司法?是制定或大篇幅修改公司法首先应有确定答案的问题。否则,将影响公司法体系的和谐统一和调整效果。“管制型公司法”“自治型公司法”均已不合时宜。中国未来的公司法应是“促导服务型公司法”。相应的价值序列必须是效率优先,兼顾公平和交易安全。公司法的修改应当围绕
期刊
近年来,我国资本市场改革迈入深水区,全面注册制加快上市步伐实体经济“脱实向虚”明显,实体企业金融化问题尤为突出。数字化时代到来,为实体企业合理管理金融资产提供了新物质基础,实体企业数字化转型意味着数字技术和传统产业的深度融合,通过商业模式、运营流程、组织、产品和服务数字化协同发展,降低生产和交易成本,提高资源配置效率,从而改善金融资产运营方式,能够抑制企业金融化效率。同时。在数字经济跨越式发展的背
学位
报纸
数字经济背景下,数字技术逐步渗入到企业的经营运作,对企业绩效发挥着至关重要的作用,数字化转型已成为企业应对市场环境变化、谋求发展的现实需要。21世纪以来,作为产业转型升级主体的企业来说,其商业环境的不确定性和复杂性加剧,企业绩效难以提升。譬如,我国企业普遍存在自主创新能力缺乏、产品供给质量不高、内部控制效率偏低等问题,加之新冠疫情的冲击,使得企业的市场绩效活力缺失。而数字化转型作为应对商业环境变化
学位
为了恢复象洞溪流域河道生态环境,达到河流水生态系统平衡发展的目的 ,对流域范围内的河道底泥情况进行调查。根据现场调查结果可知,现状河道底泥污染严重,对流域河道生态影响较大。综合考虑,采取地形改造、建设河岸拦截带、投放生态物种等方案进行处置,可为类似河道治理工程提供参考。
期刊
针对电力负荷建模过程中数据可能存在的异常值以及异常值对模型性能的影响,提出了一种基于自适应加权最小二乘支持向量机(AWLS-SVM)回归的短期电力负荷预测方法。该方法基于负荷样本数据,根据最小二乘支持向量机(LS-SVM)回归模型的拟合误差,自适应地赋予每个样本不同的加权系数,以克服异常样本点对模型性能的影响,并采用粒子群优化(PSO)算法对其参数进行优化选择。仿真实验表明,AWLS-SVM方法能
会议
随着中国经济的迅速发展和国际地位的提升,海外高校的汉语课堂数量也逐年增长。对美国和加拿大四所大学的汉语学习者和非汉语学习者进行了调研,探究学习中文是否可以加深外国学生对中国文化的了解以及对中国文化的喜爱,是否会促使学生采取一些有利于中国的行动,从而探究海外汉语课堂是否真正对中国文化的传播和国家形象提升起到一定作用。
期刊
为研究桥面板采用叠合板形式(上层及槽孔处采用超高性能混凝土UHPC,下层采用普通混凝土NC)的波形钢腹板工字钢组合梁的弯曲性能,开展波形钢腹板工字钢-UHPC组合梁(简称CSRCU)和波形钢腹板工字钢-NC组合梁(简称CSRC)的抗弯试验,探究了试验梁的破坏特征、承载能力和应变发展规律。基于试验开展了参数敏感性分析,研究了剪力连接度、NC板厚和UHPC板厚比和叠层板等效厚度对组合梁力学性能的影响,
期刊
为了解汾河中游底泥重金属污染分布现状、揭示其污染物来源,选择中游磁窑河入汾口至文峪河入汾口以下2 km河段为研究对象,采集5个断面上共35个底泥柱状样(底泥深度0~70 cm),分析重金属垂向及沿河道分布特征,并采用主成分分析法(PCA)和正定矩阵因子分析法(PMF)揭示其污染物来源。结果表明:Hg、Cu、Pb、Cr、Ni整体表现为在40~70 cm深处底泥富集,40~70 cm深处含量为0~40
期刊
火灾是钢结构的主要安全威胁之一,传统钢结构的主要防火措施为涂抹防火涂料、浇筑混凝土形成组合结构或设置防火板,其中又以防火涂料应用最为广泛。然而,室外涂抹防火涂料耐久性差,存在坠落伤人隐患。且对于防火要求较高的钢结构需厚涂防火涂料,尤其影响地标性建筑的建筑效果。近年来,耐火钢作为一种新型的防火保护措施逐渐兴起,其能够有效避免上述防火措施的缺点,但由于大量添加合金元素Mo导致其成本往往较高。南钢集团研
期刊