基于机器学习的时间序列预测关键技术及其应用研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:watta515
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国经济的飞速发展以及全球化的加速进行,在工业生产、经济活动、气候变化、能源生产分配、交通运输等各个领域中都产生了大体量、多类别、多维度的海量数据。其中,时间序列数据能够客观有效的反映各领域中不同现象和活动的变化过程,其背后蕴含了丰富的演变规律。对这些时间序列数据进行分析和研究便可从中学习和总结出相关的数据变化规律,而若能有效的掌握这些规律并且将其运用于实际的生产生活等活动中,便可实现优化资源配置、节能降耗、风险规避、优化决策等目的,具有重大的现实意义和实用价值,这也是精准时效的时间序列数据预测的基础目标。而随着科学技术的飞速发展,我们即将步入万物互联的物联网社会,这势必将带来更多类型和更大体量的时间序列数据,时间序列预测将具有数据样本海量化、数据类型多样化、预测目标多元化等特点,这也使得时间序列预测成为了一项极具挑战性的研究。由于时间序列数据的变化既具有一定的周期性规律,又受到各类随机性因素的影响,因此其波动往往具有复杂的周期性、随机性和非线性的特点,这使得准确且具有时效性的时间序列预测变得更加困难。而传统的时间序列预测方法在面对现代化时间序列数据迸发式增长所带来的体量大、类别多、变化快的挑战时,越来越难以满足应用需求,这对高精度、高稳定的时间序列预测方法提出了新的挑战。为了提高时间序列预测方法的预测效果和应用价值,本文结合各领域实际应用,针对时间序列预测中的一些关键性问题进行了深入研究,主要研究内容和创新工作如下:(1)突破传统时间序列预测方法在特征数据集选取方面的限制,提出构造溯源数据,并提出基于溯源数据的时间序列预测方法。针对不同时间序列预测应用场景,深入挖掘其数据变化波动的内在机理和原因,从多个维度进行数据采集和特征提取,在大量已经证实与特定时间序列数据变化相关或具有潜在相关性的数据中进行特征筛选从而构建溯源特征,为预测模型提供全面、立体的数据支撑。通过对美国缅因州、德克萨斯州的电力负荷数据以及澳大利亚新南威尔士州的电价数据进行案例研究,利用基于溯源数据特征的预测方法与基于传统特征的预测方法进行对比,结果表明溯源数据的引入能够有效的提高电力负荷预测和电价预测的预测精度。(2)提出基于交叉多模型和二次决策机制的时序预测方法,该方法针对传统连续型训练数据集不能反应时序数据跨时段的变化效应以及基于相似日的离散型训练数据集不能有效的捕获时序数据在短期内的波动趋势的问题,提出构造交叉训练集,从水平时序方向和垂直时序方向进行多个训练数据集的构建,使得该交叉训练集既能够反应时序数据跨时段的波动规律,又能够捕获其短期内的波动趋势。基于交叉训练集构造交叉多模型并进行二次学习,提出二次决策机制,构造多决策模型,有效的提高了该方法的泛化能力和应用范围。基于新加坡日最高负荷、澳大利亚新南威尔士半小时负荷、美国新英格兰地区日总负荷以及美国加利福尼亚州交通流量数据进行的案例研究显示,该方法具有较高的准确性和稳定性。(3)为了提高多模型预测结果集成的精度,提出了自适应权重分配策略对多模型的输出进行加权集成,根据验证集上不同独立预测模型的预测精度进行权重计算,剔除模型输出结果的极值后进行集成。该方法与传统的平均集成策略、基于性能的集成策略和竞争择优集成策略相比,具有对异常值不敏感、集成精度高的优势,对多模型进行自适应权重分配能够有效的降低多模型集成结果的预测误差。基于美国缅因州日最高负荷预测数据的案例研究表明,本文所提出的自适应权重分配策略能够为多模型预测方法提供高精度、高鲁棒性的集成结果。(4)对特征数据集选取、训练集构造、模型构建和多模型集成四个层面的创新工作进行有机结合,提出基于溯源数据和交叉多模型的时间序列预测方法。在特征数据集层面,构造溯源特征数据集,旨在系统全面挖掘造成时序数据波动的源头因素,通过揭示其波动的内在机理为预测模型提供立体、丰富的波动规律。在训练集层面,交叉训练集反应了时序数据在不同方向的波动规律进而提供了立体、多样的样本信息。在模型层面,二次决策机制的应用有效的提高了决策阶段模型的预测性能,提高了该方法的泛化能力,也扩展了其应用范围。在决策多模型集成层面,应用自适应权重分配策略,使得性能更好的独立模型得到更高的权重,提高了集成结果的准确性和稳定性。
其他文献
混凝土面板堆石坝(简称面板坝)具有整体断面小、施工进度快和复杂地形适应性好等显著优点,深受坝工界青睐,已成为高坝建设的首选坝型。近年来,随着国家“西部开发”、“一带一路”等重大战略的深入推进,一批世界级高坝大库正紧锣密鼓地规划筹建,如古水、拉哇、大石峡、茨哈峡等。但这些高坝地处我国西部强震区,设防烈度高(不低于8度)。大坝建成后将长期运行(甚至超百年),服役期遭遇强震的概率较高,存在强震破损风险。
预应力自复位(Post-tensioned self-centering,以下统称PTSC)混凝土框架是预制装配式建筑的一种,它采用无粘结预应力筋将预制梁柱紧压在一起,梁柱接触面在受拉方向不采取任何约束方式,使得构件可以在节点转动过程中相互分离,节点的非线性变形集中在梁柱交界处产生的张开角中,避免了传统现浇节点中受拉纵筋的屈服和梁端塑性铰的形成。采用附加的阻尼装置满足结构的耗能需求,从而将非线性滞
随着大数据时代的到来,人们不再为数据匮乏而感到困扰,反而越来越关注数据的质量问题并开始探讨从大量数据中提取最有价值信息的方法设计与理论研究。作为该系列研究的重大研究课题之一,异常检测侧重于检测和识别数据集中与大部分样本存在显著差异的异常样本,已成为在网络安全的入侵检测、机器设备的故障检测、医疗图像的癌变细胞识别、金融行业的信用卡欺诈检测等多个领域的热门研究话题。目前大多数的异常检测研究专门针对某个
众所周知,传统光学成像极易受到周围条件以及成像距离的影响。针对这种情况,上世纪八十年代在量子物理和成像技术的结合下衍生出了一种新型的成像方式,即主动照明关联成像,也称鬼成像。与传统光学成像的不同之处在于,它并非利用探测器直接对物体进行成像,而是通过二阶或者高阶关联的方法在不含物体的光路中重构目标图像。在成像过程中,接收物光的桶探测器只统计光强值,并不需要进行空间分辨测量,而与之关联的另一路光束在空
语音情感识别技术是语音信息处理和人机交互领域的研究热点之一,它通过分析和识别语音信号中情感信息来判断说话人的情感状态,使机器具备与人类一样的情感感知和处理能力。研究者利用传统机器学习作为分类器,构建起语音情感识别系统。近年来,深度学习被引入到语音情感识别处理中,提高了语音情感识别的识别性能。因此,研究识别性能更优的基于深度学习的语音情感识别模型对促进语音情感识别领域的发展具有重要意义。相比于传统的
石油中含有的石油烃和重金属都是持久性污染物,两者都具有很强的毒性特征可致畸、致癌和致突变,对人类健康和生态安全造成了极大的潜在威胁,如何安全有效修复石油污染土壤已经成为环境领域亟待解决的问题之一。国内外的研究人员开展了许多石油污染土壤治理的实验。生物修复技术因具有成本低、不破坏植物生长所需的土壤环境、没有二次污染、操作简单等优势引起了人们的广泛关注。但在研究中发现油污土壤中的高分子链石油烃具有较强
碳点(Carbon dots,CDs),分为石墨烯量子点(Graphene quantum dots,GQDs)、碳纳米点(Carbon nanodots,CNDs)和聚合物点(Polymer dots,PDs)等三类,是一种新型的碳基零维荧光纳米材料,具有良好的生物相容性、低毒性、独特的荧光可调性、卓越的催化性、优异的光稳定性和环境友好性等特点,在生物医学、光电器件、催化和化学传感等领域中应用广
基因沉默,又称为RNA干扰,是真核细胞调控基因表达的一种重要的分子机制。在真核细胞中,小分子RNA引导AGO蛋白至m RNA形成RNA诱导沉默复合体,小分子RNA通过碱基互补配对的方式与靶RNA结合,利用AGO蛋白水解酶的性质,通过切割降解靶RNA或抑制靶RNA翻译的方式调控靶RNA的表达。在哺乳动物细胞中,AGO2是唯一一个具有切割活性的AGO蛋白家族成员,在哺乳动物基因表达的调控过程中发挥着重
多孔金属是一种结构/功能一体化材料,在航空航天、国防军工、车辆交通、生物医疗等众多领域具有广泛的应用空间和良好的应用前景。相比随机结构多孔金属,有序多孔金属的结构规则有序,设计性和可控性强,因而有利于性能优化和扩展应用,因此有序多孔金属的结构设计必然是该领域的研究重点。结构设计是优化有序多孔金属力学性能的重要方法,而向有序多孔结构内部引入填充物替代原有气相,进而获得基于有序多孔金属的双连续互穿结构
双开口气波制冷机是一种以双开口气波管为核心部件,利用非定常波使两股气流进行能量交换,实现气体冷热分离的新型膨胀制冷装置。由于该装置具有结构简单、转速低、可带液等优点,故其具有广阔应用前景。目前,此类制冷机等熵膨胀效率可达65%。气波管内非定常流体与管壁间存在脉动流固传热现象,是造成等熵性能损失的重要因素之一,特别对于小流量、大膨胀比的制冷机,影响尤为显著。深入研究双开口气波管脉动流固传热与制冷强化