基于混杂文本数据的民航不文明旅客分类模型研究

来源 :中国民航大学 | 被引量 : 2次 | 上传用户:cnsafety
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
航空安全是民航永恒的话题,民航不文明旅客分类是航空安全的重要内容。世界各国逐渐建立起民航不文明旅客分类系统,目的是识别不文明旅客,对不同危险级别旅客实行相应的安全措施。民航不文明旅客分类过程中会运用到旅客个人信息、网上记录、公安违法记录、旅游记录、电信记录、银行记录、舆情记录等数据,这些数据我们统称为民航旅客记录。目前民航不文明旅客分类遇到的主要问题是民航旅客记录中文本数据的特征提取和分类。尤其是文本数据中的混杂文本,因为现有的自然语言处理方法主要是针对单语文本,处理混杂文本时存在很多问题。因此,研究混杂文本的特征提取方法来提高民航不文明旅客分类准确率的需求极其迫切。针对以上问题,本文首先提出一种基于深度学习模型的混杂文本特征提取和分类方法。该方法结合双语向量和双通道深度学习网络,采用卷积神经网络和注意力机制来提取中文的局部关键特征,采用双向长短时记忆网络和注意力机制来提取英文上下文相关的全局关键特征,最后将两个通道提取的文本特征进行组合。实验结果表明,该方法有效解决了混杂文本特征提取困难的问题。在此基础上,进一步研究了民航旅客记录中文本数据的提取方法,提出了一种基于组合特征的民航不文明旅客分类模型。该模型为三通道的深度学习网络,采用双通道深度学习网络提取民航旅客记录中的文本数据特征,增加一个通道提取类别数值数据特征,最后将三个通道提取到的特征组合后分类。经过实验验证,该模型的民航不文明旅客识别率达到90.9%,民航不文明旅客分级准确率达到92.8%,有效提高了民航不文明旅客的分类精度。
其他文献
自2017年全国新一轮课程改革以来,教育研究者与一线教师们针对如何培养学生的学科核心素养展开了大量的讨论。化学学科作为一门自然科学承载了提升国民科学素养、培养下一代科学家的重要职责,2017年版《普通高中化学课程标准》中凝练了化学学科的学科核心素养,这些素养指导化学教师们明确通过化学课程需要培养学生怎么样的能力与观念,主要包括科学方法、科学思维、科学与社会等。“证据推理”作为化学学科核心素养之一,
目的:本文基于微流控芯片技术筛选出鹤草药材药效物质组分,并优化仙鹤草药材药效物质组分的提取纯化工艺,同时建立仙鹤草药材药效物质组分的相关质量标准,在此基础上开展仙鹤草药材药效物质组分体外抗肝肿瘤药效及作用机制研究,为中药抗肺肿瘤新药的开发提供一定的实验参考。方法:1.基于微流控芯片技术,采用Hoechst 33342/PI荧光双染法,以细胞凋亡坏死率为考察指标进行仙鹤草药材药效物质组分筛选研究;以
在涡轮叶片实际加工、安装和装配等环节中,由于工艺水平等原因,叶片的实际安装角与设计安装角会存在一定误差,而叶片安装角的改变会导致来流攻角发生变化,这将直接影响涡轮叶栅的气动性能,使得其在一定程度上偏离设计工况。在CFD计算时我们通常采用确定性参数作为边界条件,忽略掉安装角的不确定性带来的影响,这将导致计算结果偏离实际工况。基于该技术背景,本文研究叶片安装角变化对叶栅气动性能影响的不确定量化问题,而
2008年,胡庚申首次提出生态翻译学理论。这一理论认为翻译过程是译者适应选择的交替循环过程,生态翻译学理论以翻译适应选择论为核心,为开展社科类文本的翻译实践活动提供了
一个合格的读者需要同时掌握阅读文学文本和实用文本的能力,这二者不可或缺。帮助学生形成和提高阅读能力的方法数不胜数,语文教学便是最有效的方法之一。在语文教学中应该将以上两种阅读能力放置于相同的地位。但是在我国的阅读教学中,很多老师喜欢和重视文学类文本的教学,遇到实用类文本便草草了之,这样的做法既与课程标准的内涵相违,同时不利于学生的全面发展。新闻、报告、演讲稿等实用文频频出现在人们的生活中,因而实用
第一部分结直肠癌中BRAFV600E基因突变与肿瘤相关巨噬细胞、肿瘤相关成纤维细胞的关系目的:探讨结直肠癌中肿瘤相关巨噬细胞、肿瘤相关成纤维细胞与BRAFV600E基因突变之间的
目前,肿瘤仍然是威胁人类健康最为严重的疾病之一,传统肿瘤治疗方法包括肿瘤切除、化学疗法与放射疗法等,但是这些传统治疗方式具有一定的局限性,治疗效果并不理想。光热疗法
热对流不仅广泛存在于自然界中,而且由于其优良的换热效果,在工业中也常常被应用于换热器和电子元件的冷却、晶体生长以及核反应堆设计等领域。Rayleigh-Bénard(RB)对流系统是从众多自然现象和工业实际中抽象出来的热对流物理模型。其中,Prandtl(Pr)数作为表征流体特性的系统控制参数,对RB对流有着非常重要的影响。然而,在以往的工作中,这方面的实验研究还比较缺乏。本文对Pr数如何影响RB
[目 的]探讨结直肠腺瘤性息肉发生的影响因素。探讨非酒精性脂肪性肝病(NAFLD)与结直肠腺瘤性息肉的相关性及NAFLD严重程度与结直肠腺瘤性息肉发生风险的关系。[方法]选取201
我国因缺乏优质粗饲料资源,在动物生产中大量使用富含淀粉的高谷物饲粮饲喂牛、羊等反刍动物,这样使得奶牛等反刍动物的亚急性瘤胃酸中毒(SARA)的发病率高达近30~40%。如何采用有效方法来预防或控制反刍动物瘤胃酸中毒的发生?成为生产中急需解决的问题。本研究旨在研究β-谷甾醇对湖羊瘤胃发酵及其微生物区系的影响,为其在养羊生产中应用提供理论依据。试验一、体外法研究β-谷甾醇对湖羊瘤胃埃氏巨型球菌生长的影