基于语义的民航收益系统多源异构数据融合方法研究

来源 :中国民航大学 | 被引量 : 0次 | 上传用户:lywy0201
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
机票代理人利用民航收益漏洞,产生大量无效订票,给航空公司造成极大损失。目前民航收益系统无法完全避免收益漏洞带来的损失。为了从根本解决收益漏洞的问题,只有依靠先进的数据挖掘技术去发现可疑订单从而封堵漏洞。而民航收益系统中的海量多源异构数据,具有多模态、高维度、缺失值多的特点,给传统数据挖掘任务造成极大的困难。为了能够高效完成数据挖掘任务,本文着眼于多模态数据融合,利用先进的数据融合技术完成多模态数据挖掘任务。本文首先提出了一种基于K-means的大规模多模态数据的融合算法(RMSKMC),通过寻找单个模态上的最优子空间实现高维数据的自降维,利用非负矩阵分解(NMF)对损失函数进行重构,使不同模态共享相同的聚类指示矩阵从而实现多模态信息互补,完成大规模多模态数据融合,最后结合K-means算法,完成数据挖掘任务。实验结果表明,在大规模多模态数据集上,该算法比其他多模态融合算法资源消耗更小,并且具有更好的融合性能从而最终取得更好的聚类效果。在此基础上,由于民航收益系统多源异构数据集中存在大量缺失值,极大影响数据融合性能,结合上述融合算法,进一步提出基于改进MCEM的民航收益系统多源异构数据融合算法。首先对传统的MCEM算法进行改进,使之能够适合民航收益系统数据集,大大加快其收敛速度,能够快速的补全民航收益系统数据中大量的缺失数据,然后使用RMSKMC算法进行融合聚类。实验结果表明,在民航收益系统多模态数据集上,该算法收敛速度快,能较好的识别出民航收益系统中的可疑订单。本文首次将多模态数据融合引入民航收益系统收益漏洞问题中,利用多源异构数据进行数据融合,结合聚类算法,能够精确预测出可疑订单,使得收益漏洞造成的损失降为零成为可能,为今后的相关研究指明了方向。
其他文献
中国是全球最主要的大豆进口国,进口转基因大豆早已成为中国大豆油消费的主要来源。然而,近年来关于转基因安全问题的争论不断,相关负面信息广泛传播,反对转基因食品的声浪此
在被子植物中,榛子(Corylus spp.)子房和胚珠的发育特征十分独特,授粉后才开始进行子房和胚珠的发育。在果实发育过程中子房和胚珠的大量败育会造成榛子产量损失目前。目前,参与调控榛子子房和胚珠分化的蛋白仍不清楚。为此做了如下研究。从雌花序或早期子房的三个发育时期提取总蛋白,三个发育时期包括F期(未授粉的花序)、S期(早期子房)和T期(胚珠开始分化)。用同位素标记相对和绝对定量(isobari
明代是近代汉语发展较为成熟的时期,这一时期的词汇特点主要体现在新词产生、旧词消亡、词语更迭变化和词义不断演变等方面。作为戏曲作品的集大成者,《六十种曲》主要集中了
PTEN是一个常见的肿瘤抑制因子,其磷酸酶活性能够对PIP3进行去磷酸化以抑制AKT的活性。PTEN-Long(PTEN-L)是PTEN的一个亚型,国内外多数文献报道其N端173个氨基酸(PTEN-L leader)
爆破战斗部对相控阵雷达的毁伤评估研究对雷达目标的防护、战斗部的威力设计以及评估战斗部对雷达目标的毁伤效能具有非常重要的意义。本文以“爱国者”AN/MPQ-53多功能相控
近年来随着污染问题日益严重,我国出台了多项环保政策以加大对环境的治理,企业环境社会责任(简称“ECSR”)开始成为现阶段与环境密切相关企业的关注重点。在环保政策的鼓励、
背景PTEN是在许多类型的人类恶性肿瘤中,经常发生突变、缺失和转录沉默的抑癌基因。作为经典的PI3K/Akt促细胞生长信号通路的负调控因子,PTEN通过其脂质磷酸酶活性,将磷脂酰
单形谓语句是单个形容词充当谓语的简略说法,是形容词谓语句的一个下位句式,但现有研究都缺乏对单形谓语句单独的、系统全面的描写归纳。单形谓语句简洁明了,实用性高,但很多
在科学技术日新月异的当下,新一轮科技革命带来了愈发激烈的科技竞争。科研团队在攻克重难点问题、开拓创新方面拥有巨大优势,已经成为企业和科研机构的中坚力量,并逐渐成为
本文为我在某空调压缩机公司的陪同翻译实践报告。内容分为五个部分,分别是任务介绍、过程描述、翻译评价、案例分析以及对今后的展望。充分的事前准备对提高口译效果有非常