基于深度学习的多维时间序列聚类方法研究

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:wangtao7897
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间序列聚类是时间序列数据挖掘研究中的一类重要任务。由于深度神经网络能够通过对原始时序数据进行特征的提取,在降低时序数据维数、提高算法的效率同时,滤除一些不相关的信息,对噪声具有也具有较好的鲁棒性,已被引入到时间序列聚类任务之中。但现有基于深度学习的时间序列聚类算法模型无法较好地捕获时间序列的多尺度特征以及面向聚类的具有不变性的时序特征。异常航班检测是民航安全领域的一项重要任务。时间序列聚类算法在异常航班检测任务中的应用是无监督地从飞行数据中寻找离群点,帮助专家发现异常航班。快速存取记录器(QAR)是一种用于监控、记录飞机飞行过程中的飞行参数和状态的设备。QAR数据包含数百个飞行参数,如飞行姿态数据参数、驾驶员操作参数、发动机主要设备运行参数和飞行环境数据等。而目前的QAR数据聚类算法依赖于通过领域知识来手动构建高质量的特征,无法完整提取时序数据的隐藏模式和信息,限制了模型的聚类效果。本文针对上述问题,开展了以下工作:(1)提出了一种将时间序列数据的多尺度特征提取和聚类目标集成到Seq2seq网络的深度聚类模型,即基于多尺度特征提取的时间序列深度聚类算法(Time Series Deep Clustering Based on Multi-scale Feature Extraction,DTCMFE)。该模型的编码网络结合多个不同尺寸的卷积神经网络和双向门控循环单元网络提取时间序列的多尺度特征。采用基于数据增强的样本生成策略及多分类辅助模块提取时序数据中包含的不变性模式,获得针对时间序列聚类的更好的表示。在多个公开时间序列数据集上进行的实验表明DTCMFE模型的聚类结果在RI指数上指标值优于典型基线模型。(2)提出一种基于深度聚类的QAR数据异常航班检测算法(Abnormal Flight Detection Algorithm Based on QAR Data Based on Deep Clustering,AFD-DC),该方法采用DTCMFE方法中的基于双向GRU和全连接层的自编码器网络及基于时间序列数据增强的样本生成策略及多分类辅助模块,来提取QAR数据的包含时序间的长距离依赖关系和不变性模式的特征表示。再通过DBSCAN方法对提取的特征进行聚类,将不属于任何簇的点标记为异常航班。在真实QAR数据集上的实验结果表明,AFD-DC能有效检测异常航班,可以通过对多个QAR参数进行分析来解释异常航班发生的原因。
其他文献
近年来随着民航业的蓬勃发展,空中交通流量显著增加,为了避免扇区工作负荷过于饱和,扇区范围划分越来越小。这带来的问题是当夜间或是特殊的天气原因导致空中交通流量减少时,会造成对人力资源的浪费。由于当前的空域配置方案高度结构化且对情形变化的反应能力较弱,整个扇区配置系统缺乏应对空中交通流量变化所需的灵活性和适应性,有必要在战术前对扇区配置方案的灵活性和适应性进行改进。首先,本文从空中交通复杂度计算指标的
学位
随着世界民航运输业方兴未艾,空中交通流量与日俱增,不安全因素增加。传统监视技术受到选址和布站影响,容易出现监视盲区。广播式自动相关监视(Automatic Dependent Surveillance-Broadcast,ADS-B)系统应运而生。ADS-B具有安装方便、成本低,数据获取方式容易、报文内容全面丰富等优点。ADS-B技术被广泛使用,并且作为未来主要监视手段,应用于空管监视系统。对飞机
学位
随着空中交通流量的增加,空域资源日益紧张,航班延误的问题也越来越严重。在所有导致航班延误的因素当中,气象因素占有较大的比重。本文设计实现了航班延误气象因素量化分析系统,通过对历史数据进行关联分析,明确了航班延误与气象因素之间的关联关系,并将分析的结果进行可视化展示。同时,建立了基于深度学习的航班延误预测模型,能够对航班的延误等级进行预测。本系统旨在为民航相关部门提供有效的决策依据,尽量减少气象因素
学位
目的:研究乳腺癌患者初始治疗前外周血参数,包括中性粒细胞/淋巴细胞比值(neutrophil-to-lymphocyte ratio,NLR),血小板/淋巴细胞比值(platelet-to-lymphocyte ratio,PLR),以及系统免疫炎症指数(systemic immune-inflammation index,SⅡ)对患者临床病理特征和新辅助化疗疗效的预测价值,并探索其作为乳腺癌慢病
学位
研究目的胰腺导管腺癌(PDAC)是全球范围内最高发的肿瘤之一,预计将在10年内成为第二大常见肿瘤导致的死亡原因。尽管诊断手段不断进展,新的化疗方案陆续出现,该疾病的预后依旧很差。与许多其他癌症相比,胰腺癌的5年生存率非常低,只有2%到9%左右。因此,对于胰腺导管腺癌新的靶点和新的治疗方法的探索研究工作显得极为重要。近几年研究发现YEATS2(YEATS domain-containing2)在组织
学位
目的:胃肠道间质瘤(Gastrointestinal Stromal Tumor,GIST)是消化道中最常见的间叶组织恶性肿瘤,多数包含KIT和PDGFRA驱动基因的突变。伊马替尼的出现显著改善了GIST患者的预后,但是这些患者不可避免地对伊马替尼产生了耐药性,而这并不完全归因于继发性驱动基因突变。在本文中,我们研究了micro RNA-30a(mi R-30a)在GIST细胞中对伊马替尼的增敏作
学位
第一章探索影响不同位置近期皮层下小梗死发生和转归的危险因素目的:探索影响不同位置近期皮层下小梗死(recent small subcortical infarcts,RSSIs)发生及转归的危险因素。材料及方法:回顾性分析2012年7月至2016年8月脑小血管病患者库中入院时发生RSSIs的患者176例。记录人口统计学,血管危险因素,影像学指标,生化指标以及入院时候国立卫生研究院卒中量表(Nati
学位
有效地实现基于干扰现象的干扰频率辨识和预测,为提高通信系统的接收性能和实现设备的电磁防护提供参考。从系统的非线性特性出发,研究非线性组合频率干扰原理,分析基于非线性系统的谐波组合机理及影响评估,在此基础上实现对组合频率干扰与互调干扰的建模,以便对非线性系统多输入信号的输出幅值做出预测。研究结果可以较为直观地预测干扰信号存在的频段范围,结合多输入信号输出频谱特征,实现不同噪声背景下的多频干扰频率预估
学位
航空意外险是民航旅客最熟悉的商业险种,负面新闻和争议事件在近年时有发生。为了避免可能出现的“假保单”等问题,航空意外险的销售过程迫切需要可回溯管理。区块链技术作为国家重点提倡的新型基础设施,在金融、智慧医疗、信息化政务、产品溯源等领域具有重要的研究价值和应用前景。区块链已经成为推动公共服务智能化和社会治理精细化的重要技术手段。全国各个地区的多种领域都在积极推动区块链与智能技术的融合应用。首先,本文
学位
时序数据预测是时序数据挖掘研究中的一类重要问题。多维时间序列数据不仅包含时序依赖特征,也包含变量间的空间依赖特征。图神经网络可以捕获节点向量的空间依赖关系,已被引入到多维时间序列(Mutivariate Time Series,MTS)方法的建模中。现有的MTS预测方法选择使用图神经网络中最具代表性的图卷积网络捕获变量间的关联关系,然而这些方法关注时空依赖关系,没有考虑MTS各变量上的局部上下文特
学位