基于自然语言处理的空管危险源数据正则化分析方法研究

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:miss3yoyo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
不安全事件强制或自愿报告是空中交通管理领域在安全风险管理方面普遍采用的方式,报告采用自由文本加分类的结构。通过自然语言处理技术对不安全事件报告开展分析,抽取其中的危险源描述特征,对空管安全风险管理具有重要的意义。本文首先分析了空管安全管理的国内外现状,在归纳安全管理与自然语言处理的基础上,形成了空管危险源数据分析的技术基础;其次,提出了基于自然语言处理的空管危险源数据分析方案,通过对报告内容的分析,设计实现了危险源提取与分类方法,并就其中的自然语言处理、危险源分析、数据分类等方法进行了详细的论述;第三,针对不安全事件报告数据量不足的问题,提出了基于简易数据增强(Easy Data Augmentation,EDA)的危险源文本数据增强算法,并通过计算余弦相似度和Sim Hash相似度验证了算法的可行性;第四,针对数据标签不均衡问题,设计了基于极致梯度提升(Extreme Gradient Boosting,XGBoost)的改进算法,该算法集成了对损失函数的加权和正则化操作,有效改善了由数据标签不均衡导致的过拟合现象,并分别用跑道侵入和鸟击事件的报告数据进行了实验验证,实验结果表明,该方法能够有效实现空管危险源文本的自动分类;最后,利用LDA(Latent Dirichlet Allocation)主题模型提取各类危险源文本中的关键词,结合系统理论的过程分析(System-Thertic Process Analysis,STPA)方法提出了对安全管控措施的建议,为空管不安全事件的分析和危险源管控提供了支持。本文综合自然语言处理、安全风险管理、机器学习等技术,提出了一种针对不安全事件报告抽取危险源信息数据的方法,能够帮助安全管理人员识别和分析危险源,具有一定的现实意义。
其他文献
飞机货舱火灾对飞机安全飞行造成了巨大的威胁,所以火灾监测装置在第一时间发现火灾,然后机组人员立即采取措施可以保障旅客的生命财产安全与飞机安全航行。考虑到目前飞机货舱火灾监测系统研究主要集中在多传感器信融合技术的基础上,通过对多种特征参量数据的监测,来判断火灾是否发生。针对飞机货舱的空气质量而言,包括CO、CO2、臭氧、颗粒物等特征参量,而火灾发生后,主要是CO与CO2的浓度发生变化,所以本文通过对
学位
背景与目的:心脑血管性疾病已成为全球居民死亡的首要原因,且患病率及病死率仍在不断攀升。血管性疾病与吸烟、肥胖、高血脂、高血糖、胰岛素抵抗、饮食结构等不良生活方式或危险因素密切相关,约80%心脑血管性疾病可通过改变这些危险因素达到预防效果。健康饮食是预防心脑血管性疾病最简单有效的方法。膳食中含丰富的不饱和脂肪酸,既往研究表明每种不饱和脂肪酸对各类疾病的影响不同,但大部分临床研究易受混杂因素及反向因果
学位
碳核查是确保航空业减排目标得以实现的重要环节。业界采用核证航班燃油消费量的方法实现碳核查的目的。随着飞机运营人航班量的显著增加,有限的时间内高质量完成如此巨大核查工作量几乎成为难以逾越的障碍:航空器性能、载量、飞行员操纵行为和运输过程实时大气环境等综合因素会给航班燃油消费量的科学分析与工程性合理判别带来显著困难。因而,迫切需要提出新的方法来完成碳核查中油耗数据合理性的判断。基于油耗数据的分布特性,
学位
背景:肾上腺脑白质营养不良(adrenoleukodystrophy,ALD)是一种X连锁过氧化物酶体病,由ABCD1单基因突变引起,典型特征是血浆和组织中极长链脂肪酸的异常堆积。ALD的临床表型多样,从无症状到快速进展的儿童脑型不等。肾上腺脊髓神经病型是最常见的表型,起病年龄较晚,并累及锥体束、背柱和周围神经。但是,在头颅磁共振未提示脑白质明显异常情况下很难区分成人ALD与遗传性痉挛性截瘫。目的
学位
目的:1型神经纤维瘤病(Neurofibromatosis type 1,NF1)是世界范围内最常见的常染色体显性遗传病之一,以咖啡斑、皱褶部位雀斑、Lisch结节及皮肤良性神经纤维瘤为主要临床特征。NF1基因(Neurofibromatosis type 1 gene)是1型神经纤维瘤病的致病基因,具有极高的突变率。目前对于1型神经纤维瘤病的治疗仅限于手术和激光,并且有极高的复发率。因此,从基因
学位
随着机场愈加繁忙,飞机在机场飞行区发生滑行冲突等事故及事故征候屡见不鲜。以及随着空中交通管制员工作强度的逐渐增大,也逐渐提高了管制员发生“错、忘、漏”的概率,威胁到飞机的安全。对此,通过基于管制指令的飞机滑行冲突预警关键技术进行研究,实现验证管制指令的正确性、保障机场飞行区场面运行安全和给予管制员提供及时的辅助决策支持的目的。主要工作如下:首先,介绍了飞机滑行区域和飞机尾流分类新标准,阐述了飞机滑
学位
目的:自发性脑出血(Spontaneous intracerebral hemorrhage,s ICH)后早期血肿扩大(Hematoma expansion,HE)是决定患者预后的关键因素之一。本研究的目的是基于深度学习算法开发一种新的早期血肿扩大预测模型,并验证其预测效能。方法:连续收集2012年2月至2019年10月就诊于我院的自发性脑出血患者,这些患者均于起病8小时内接受头颅非对比电子计算
学位
旋转机械设备在复杂工况下的运行状态往往取决于其关键部件——转子系统。现代工业水平随着科技的提升不断彰显新的高度,旋转机械设备身处其中也在不停的创新发展。由于运行工况复杂多变,高故障率的转子系统使得机械设备故障频发。设备出现故障后,故障因素会急速蔓延,如果不能准确发现故障并对故障原因进行处理的话,不仅会对经济造成损失,还可能导致工作人员伤亡。因此,分析转子系统故障,对在变工况下转子系统故障诊断方法展
学位
民航旅客运输态势从长期来看仍处于持续稳定增长的阶段,机场高密度、高饱和的运行状态不会发生改变,而如何提升机场运行效率和智能服务质量成为当前旅客保障亟待解决的关键问题。离港旅客作为空港服务的主要对象之一,由于未能准确感知其聚集特性,无法合理有效配置各保障区域和节点的服务资源,造成旅客拥堵现象时有发生,严重影响旅客在机场的体验感。因此,系统性研究面向航班计划的离港旅客聚集特性成为机场提升自身满意度的主
学位
作为无人仓储管理系统中基本组成部分,移动机器人的自主定位能力是不可或缺的。视觉SLAM(Visual Simultaneous Localization and Mapping,VSLAM)为实现自主定位能力提供强有力的理论和技术支撑,但无人仓储实际场景给VSLAM系统稳定运行带来了约束和挑战,无人仓储环境中低纹理、重复纹理以及场景变化等因素都会使得VSLAM系统定位精度下降。特征跟踪精度和回环检
学位