交通领域下在线集成时间序列预测方法及应用研究

来源 :湖南大学 | 被引量 : 0次 | 上传用户:birchwoods2010
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
交通领域下的时间序列数据(time series data)是指某一时间段下顺序采集到的数据,它通常用于客观地描述和记录车辆行驶过程中的某一事物或现象随时间变化的发展规律。通过对该领域下的时间序列数据进行分析,可以很大程度地挖掘数据中所隐藏的变化规律,从而对构建和谐交通、拥堵避免以及安全行驶做出重大贡献。而时间序列预测是分析时间序列数据的主要方式,它可以通过挖掘数据中所隐藏的变化规律,构建其预测模型来预测某一现象或事物的发展趋势。因此,如何构建交通领域下的时间序列预测模型具有重要的现实意义和研究价值。
  在构建时间序列预测模型时,通常需要考虑以下两个方面。首先,时间序列数据是一种数据体量大、种类繁多且可真实反映事物或现象变化的大规模数据,因此预测模型通常必须具备训练大规模数据集的能力,而在线学习(online learning)是实现大规模数据学习的技术手段之一;其次,在非平稳环境中采集数据时会受到外部环境的影响,使得数据原本的分布情况随时间的推移发生改变,即存在概念漂移(concept drift)的现象,而集成学习(ensemble learning)作为一种辅助框架为解决概念漂移问题提供了重要的突破口。针对时间序列预测中存在的待处理数据庞大和概念漂移的问题,本文以交通领域中采集到的时间序列数据为基础,结合在线学习和集成学习,对如何构建基于在线集成学习的时间序列预测模型展开研究。本文主要的工作和贡献如下:
  1.提出一种基于非参数核平滑的在线集成回归模型
  在线学习是一种有效提高机器学习算法空间效率的技术,而集成学习作为实现组合算法的技术之一被广泛地应用于模型的性能优化领域。针对在线学习不允许再训练导致的参数选取困难的问题,提出一种基于非参数核平滑的在线集成回归模型。该模型首先引入拓扑学习神经网络,通过改进核密度回归方法将拓扑学习神经网络转换成一种前馈神经网络,并推导出相应的回归表达式;然后,设计最大似然估计用于回归模型的自适应参数选取;最后,通过结合集成学习的加权训练策略,提高拓扑学习回归预测模型的性能。所提出的方法在UCI数据集和交通流数据集上的对比实验结果表明,该方法的预测精度最高可分别提升45.27%和54.29%。
  2.提出一种基于分类型损失函数的增量回归预测模型
  在非平稳环境下所收集到的数据会受到外界环境影响而发生分布上的变化,即概念漂移的发生。不同的非平稳环境会发生不同的概念漂移,其中包括突然地、快速地、渐进地或周期性地甚至是变化率不同的概念漂移。因而导致具有固定的模型类型和参数设置的传统时间序列预测方法的性能逐渐下降。针对概念漂移带来的预测困难,提出一种概念漂移环境下的增量回归模型,以解决在非平稳环境下的数据分布变化问题。该模型首先通过将时间序列预测的回归任务转换为二元分类任务;其次,基于此变换构造出用于增量学习和集成学习的分类型损失函数;最后,通过将逐步更新的分离超平面进行公式推导得到最终的增量回归模型。在交通流预测应用上的实验结果表明,该方法的表现相较于现有的增量回归和集成回归方法更具稳定性,其预测精度最高可提升53.41%。
  3.提出一种基于在线迁移回归的集成位置预测模型
  时间序列数据通常存在前后点不一定是相邻时刻,即可能发生数据缺失的问题。尤其是在基于GPS设备的采集过程中,由于采集频率、设备精度、以及基站和GPS信号强弱等不同层次的原因,造成所采集到的位置时序数据在时间刻度上的观测值是不准确的甚至是缺失的。针对因GPS信号中断所带来的位置时序数据丢失的问题,提出一种在线迁移回归模型。该模型首先将GPS数据和辅助车辆行驶数据进行融合再进行训练;然后,在数据缺失期间,利用迁移学习来降低不利于当前情况下的训练样本的权重;最后,通过建立分类类型损失函数以进行集成回归学习,从而获得在线迁移回归模型。实验采用了真实的车辆位置数据集来验证,其结果表明所提出的方法相比现有的方法的预测精度提高了13.47%—61.51%。
  4.提出一种基于自适应分类型加权策略的在线集成LSTM预测模型
  单个长短期记忆神经网络(long short-term memory, LSTM)因其特殊的网络结构导致其训练时会产生大量的网络参数。且在每一个时间步长内会快速修改和更新LSTM记忆单元,从而对网络内部进行动态调整。针对单个LSTM的参数优化工程量大和内部变化难以捕捉的问题,提出一种基于自适应加权策略的在线集成LSTM预测模型。该模型首先基于虚拟二分类思想构造出用于回归任务的分类类型损失函数;然后,为了捕获基础LSTM模型在每一个时间步长下的变化,设计出一种自适应分类型加权策略,从而得到基于LSTM的在线集成预测模型。在交通速度预测应用上的实验结果表明,所提出的预测模型在性能上比单个LSTM模型提升了35.13%—48.02%,且比现有的集成LSTM方法提高了14.5%—28.45%。
其他文献
忆阻器具有非易失性,能很好地模拟神经突触,从而被广泛地运用于神经网络中。基于忆阻器的良好特性,用忆阻器替换传统神经网络电路模拟中的电阻可以构建新型神经网络,即忆阻神经网络。因为同步、多稳定性等动力学行为在安全通信、图像加密、联想记忆存储等领域具有广泛的应用前景,从而忆阻神经网络的同步及多稳定性受到国内外学者们密切关注。此外,不同的忆阻神经网络模型也有不同的应用场景,如二阶忆阻神经网络中引入的惯性项通常是产生更加复杂的分叉与混沌行为的一个关键因素。由于忆阻神经网络在电路模拟过程中,放大器等元件不可避免的存在
习近平总书记在中央党校(国家行政学院)中青年干部培训班开班式的讲话中指出,凡是有利于党和人民的事,我们就要事不避难、义不逃责,大胆地干、坚决地干。这一重要指示,就要求新时代党员干部要有新担当新作为,以行动彰显实干、以实干扛起担当,干出一番事业、擎起一片蓝天。   要有忠诚于党的坚定信念。要让群众看得出,就要有坚定的理想信念,矢志不渝的事业追求。不可否认,现实中有的党员信仰发生偏移,不信马列信鬼神,
期刊
手绘草图是一种简洁且高效的表达方式,在人类社会漫长的发展中扮演着重要的角色,方便了人们交流和信息传递。现代社会中,手绘草图被广泛用于设计创作领域,比如动画卡通、建筑设计、服装设计等。然而,现有的计算机辅助设计系统需要人们在完成手绘草图创作之后,继续对该草图进行手工的语义标注操作,这是由于计算机还不能准确地解释手绘草图中人们表达的语义信息。如何利用计算机实现自动且高效地对手绘草图进行精准地语义解析与识别,进而提升相关从业人员的工作效率,是一项极具意义和挑战性的前沿课题。
  手绘草图语义解析与识别任务
日益发展的高带宽应用导致接入网流量的爆炸式增长。接入网肩负着连接用户的使命,其通信速率制约了终端用户最终所能获取的带宽资源。结构简单、成本低廉的强度调制直接检测(Intensity Modulation Direct Detection,IM/DD)光通信系统很适合应用于对成本非常敏感的接入网中,先进的调制格式和相关的数字信号处理技术(digital signal processing,DSP)能大大提高光通信系统的传输速率。因此,通过研究适用于IM/DD光通信系统的先进调制和DSP技术来克服系统传输中的
中国式民主是一种全过程的民主,不仅需要完整的制度程序,而且需要完整的参与实践。在当代中国,人民当家作主具体地、现实地体现到中国共产党执政和国家治理之中,具体地体现在国家权力、司法机关运行之中,也具体地体现在人民参与社会治理和基层自治之中。可以说,在中国,国家治理本质就是民主治理。  中国共产党民主执政   在70多年的执政实践中,中国共产党形成了较为成熟的民主执政理念,探索出高效的国家治理模式。中
期刊
随着科学技术的进步和移动互联网的迅猛发展,高性能计算技术在工业界和科学计算等领域发挥着越来越重要的作用。鉴于这些应用领域中数据规模的爆发式增长,为了能够高效处理超大规模数据,亟需研究面向领域应用的高性能并行基础算法。
  当前我国超算系统的研制能力己居世界前列,研制的“天河”系列和“神威,太湖之光”异构并行超级计算机的峰值运算速度己数次位居世界第一。但现有的加速基础算法多为面向同构系统或单节点加速器而设计,缺乏能扩展到大规模异构并行计算系统、充分发挥异构系统计算效率的基础算法,难以为实际应用需求提供
作为一种有用的光谱检测手段,表面增强拉曼散射(Surface-enhanced Raman scattering,SERS)自1974年被发现至今,在大量研究人员的努力下,SERS已经发展成为一项较为成熟的技术。由于其具有高灵敏度(可用于痕量分子检测,甚至单分子检测),无损伤检测以及指纹识别的优点,SERS技术可以被应用于化学和生物传感,医学成像,环境和食品安全等领域。但是限制SERS技术广泛应用的主要挑战之一在于缺乏有效的SERS基底。因此,设计并合成高灵敏、均匀、高度兼容性的SERS传感器对此技术的实
随着计算机网络的快速发展,网络规模也越来越大,这给网络测量与网络异常检测带来了不少的挑战。一方面,网络性能数据是网络异常检测的基础,而获取网络性能数据的关键在于网络测量技术。传统的网络测量技术常针对节点规模为n的实际网络,获得全网的性能数据代价通常需要O(n2),当网络规模较大时,通过现有的测量方法进行网络测量显然是不切实际,且网络性能数据具有连续性,针对全网性能数据进行连续测量不仅需要较大的通信代价,且无法满足时效性。另一方面,随着网络规模的不断扩大以及网络应用的持续深化,网络攻击的危害性越来越大,威胁
换届是干部集中调整期,必然涉及进退留转。在换届选举中,许多党员干部展现了高度的政治觉悟和宽广的胸襟气度,坦然面对“进退留转”,进是责任加重,退是甘愿奉献,留是当好传人,转是迎接挑战。   要切实提升站位。人事有代谢,往来成古今。干部的进退去留,是干部队伍建设的正常现象,更是党的事业发展的客观需要。要充分认识换届工作的重要意义,强化政治忠诚,保持政治定力,顾大局、守规矩,牢固树立正确的权力观、地位观
期刊
择一事,终一生。李桓英的一生只为一件事——世间再无麻风。   作为归国华侨,她主动舍弃国外优厚条件,毅然投身麻风病防治工作,被亲切地称为“抗麻斗士”。   作为一名医生,她以救死扶伤为己任,救治了无数麻风病患者,成为病人口中的“李妈妈”。   作为科学家,她提出的垂直防治与基层防治网相结合模式,被称为麻风病“全球最佳的治疗行动”。   作为一名95岁时入党的共产党员,她“愿以党员的身份为麻风事业奋
期刊