面向工业大数据的时间序列迁移预测方法

来源 :河南师范大学 | 被引量 : 0次 | 上传用户:free_1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着“工业4.0”时代的到来,工业大数据分析成为制造企业运维管理、电力资源管理等领域的关键技术之一。作为工业大数据的典型形态,时间序列在各类工业应用场景中主要以两种形式存在:间歇性时间序列和周期性时间序列。前者强调数据呈间歇性和块状分布,后者强调数据演化具有明显的周期性和规律性。对各类时间序列的有效预测已成为工业大数据分析的核心任务。目前,机器学习技术已被成功应用于时间序列预测问题,但在实际应用中,受传感器测量误差、人工操作失误等因素影响,易导致数据质量较差或某些场景数据量不足,进而影响机器学习建模效果。为解决上述问题,本文拟引入迁移学习技术,利用相关但不相同的辅助序列数据提高目标序列的预测效果。具体而言,本文以时间序列内在演化信息的提取和表示为切入点,分别针对间歇性序列和周期性序列这两类序列的分布特性,构建序列演化信息的传递通道,建立时间序列迁移预测模型。主要研究内容包括:(1)间歇性时间序列中“0”元素较多、且有效数值呈间歇性和块状分布,导致序列演化规律难以直接提取和传递。为解决该问题,本文提出了一种间歇性时间序列的可预测性评估及联合预测方法。首先提出了一种新的间歇相似度指标,通过统计两条序列中“0”元素出现的频次和位置,并结合最大信息系数和平均需求间隔等度量指标,有效评估了序列的趋势信息和波动规律,实现对间歇性序列可预测性的量化;其次,基于该指标,构建了一个间歇相似度层次聚类方法,自适应筛选相似性高、可预测性强的序列,剔除极度稀疏、无法预测的序列,并分别构建了多输出支持向量机(M-SVR)和多任务学习模型,前者充分利用多个任务之间的输出端结构化信息进行建模,后者则首先通过张量重构的方法降低可预测类序列中随机需求的峰值点,然后构建多任务学习回归模型,实现联合预测。最后,分别在两个公开数据集(UCI礼品零售数据和华为电脑配件数据)和某大型车辆制造企业实际配件售后数据进行实验验证。结果表明,与现有多个典型时间序列预测方法相比,本文方法可有效挖掘各类间歇性序列的可预测性,实现多个任务之间结构化信息迁移,提高在数据量不足时的间歇性序列预测精度。(2)现有时间序列预测方法往往因数据质量问题无法对序列演化的周期规律进行有效建模,尤其难以准确预测峰值处的序列走势,造成整体预测效果理想、但关键位置预测效果不佳的现象。为解决此问题,本文提出了一种鲁棒周期性信息融合的时间序列域对抗迁移预测模型。该模型采用域对抗神经网络(DANN)为基础迁移算法形式,其中特征提取器采用长短时记忆网络(LSTM),用以提取源域和目标域序列之间的公共时序特征;将全连接层的输出使用LSTM构建回归预测器。此外,为缩小源域序列和目标域序列在数据分布和形状波动上的差异,构建序列峰值不规则形状损失项、预测滞后损失项,作为正则项加入整体损失函数,进行对抗训练,实现序列周期性波动趋势信息的迁移,提高模型的预测精度和鲁棒性。最后将该方法在欧洲交易所的电价数据集上进行实验验证,发现利用北欧、中欧和中伏尔加地区的电价序列数据,可有效提高数据质量不高的西伯利亚和南欧地区的电价走势,在整体预测效果和峰值处的预测精度均有显著提升。综上所述,本文针对工业大数据中常见的两类时间序列数据,从序列间演化信息的提取和传递入手,通过构建时间序列迁移学习预测模型,实现了间歇性序列和周期性序列的迁移预测,预测结果鲁棒、准确,为提高实际工程中时间序列预测精度提供了新的解决方案,具有明确的理论价值与应用价值。
其他文献
随着消费金融在我国快速的发展,客户的逾期率和消费金融公司的不良贷款率稳步上升,催收作为贷后风险控制不可或缺的一环,在降低客户逾期率和不良贷款率方面发挥着越来越重要的作用。在银保监会对于消费金融公司催收的监管力度愈发严格,同时受媒体“暴力催收”的舆论影响,以及催收行业对于从业人员个人能力的高要求的背景下,外访催收人员工作压力也愈发严重。本文研究的目的是希望通过对J消费金融公司外访催收人员工作压力的研
学位
近年来信息技术蓬勃发展,随之而来的是数据量暴增。在日常生产生活中,越来越多的数据被获取并存储。然而一些数据对于分类任务来说是不相关或冗余的,且这些冗余数据对做出正确的决策会产生影响。因此,如何有效地处理冗余数据已然迫在眉睫。虽然特征选择方法已被广泛应用,但大多数的特征选择算法仅考虑决策下近似所包含的分类信息,忽略了决策分歧的样本所提供的分类信息,从而可能导致部分信息的丢失。本研究以模糊邻域粗糙集模
学位
纵观我国的国有天然气公司,可以发现人力资源管理在这些公司都发挥着重要的作用,而在该体系中,绩效管理更是其中尤为重要的内容,可以帮助天然气公司创造更多效益,实现发展目标。尤其是改革减员增效对国有企业的发展很重要,X公司面临国企改革的环境,必须要不断提升自己的发展动力,其重要的手段就是应用强制分布法对绩效管理体系进行优化,然而在实施过程中遇到一系列问题,如何更好地应用强制分布法,起到激励员工的积极作用
学位
随着现代社会的快速发展,亟需解决的优化问题呈现出复杂化和多样化的发展趋势。机械工程设计问题是重要的优化问题之一,该问题的主要目标是在满足一定约束条件的情况下,寻找机械工程产品的一组最优参数值。传统的优化方法在解决这类问题时常面临陷入局部最优的困境,不能找到最优解,许多研究者开始采用元启发式算法(Meta-heuristic algorithms,MAs)来解决机械工程设计问题。单个MA都有自己的优
学位
随着科学和技术的进步,亟需解决的优化问题越来越多,且其复杂性大幅增加,用传统基于数学的优化方法,如梯度下降、牛顿法等,几乎不可能解决这些复杂问题。因此,越来越多的智能优化算法(Intelligent Optimization Algorithms,IOAs)被提出。为了更好地解决复杂优化问题,提出了分组结构的IOA。本文主要讨论分组结构的IOAs,如同步热传递搜索算法(Simultaneous H
学位
在互联网时代信息爆炸及地勘单位改革的背景下,媒体格局深刻变化,舆论生态更加复杂,地勘单位青年职工思想状态的波动变化更加活跃,也令地勘单位青年职工思想政治工作面对着更多的新挑战。文章简要分析了当前地勘单位青年职工思想特点,并对地勘单位青年职工思想政治工作面临的问题及其实施策略进行了论述。
期刊
随着自媒体平台的出现和高速发展,人们越来越多地关注自媒体平台上的新闻信息,观看电视节目已不再是人们茶余饭后休闲的首选,湖北电视台《新闻360》节目更是面临着前所未有的挑战。本研究以传播分众化理论与拉斯韦尔5W理论为理论基础,以湖北电视台《新闻360》节目作为研究案例,运用调查研究的方法对自媒体发展环境下湖北电视台《新闻360》节目面临的困境及原因进行深入分析,并根据分析结果提出相应的对策建议。通过
学位
数据挖掘的快速发展使其在医疗保健、金融服务、安防领域等方面得到了广泛应用,k-means聚类算法是数据挖掘中经典且常用的算法之一,具有简单易于实现、可高效处理海量数据等特点。但用户进行k-means聚类时可能会泄露自己的敏感信息,隐私保护k-means聚类可以在保护数据隐私的同时进行k-means聚类。然而,现有的差分隐私保护k-means聚类方案存在迭代效率低、服务器返回错误聚类结果的问题。此外
学位
随着科技的发展与进步,信息呈现爆发式增长,这些数据信息在生活中普遍具有复杂多样和语义丰富的特点,使得传统的单标记已无法满足当代社会对信息完整度的追求,多标记应运而生,多标记中同一个对象可被同时描述为多个类别。与单标记学习一样,多标记学习也面临“维数灾难”的挑战,所需处理的数据中存在大量冗余和不相关的信息,这将严重影响多标记分类模型的泛化能力。本文针对多标记学习中存在的维数灾难问题,使用特征选择方法
学位
现代生产运作强调合理充分利用企业资源来组织生产活动,以实现满足客户要求的高质量产品目标。因此,在生产过程中如何提高产出效率,提升客户满意度,降低运营成本,是企业能否在激烈的市场竞争中获得成功的关键。半导体行业是典型的资本和技术密集型产业,行业内部竞争非常激烈,对于半导体制造企业来说,如何合理有效地控制和管理企业在制品库存水平,降低生产成本和提升效率,是企业能否在行业中得以生存的前提条件。本文在理论
学位