知识图谱健壮性增强方法的研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:wangdalu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在知识表示领域,数据稀疏性是大规模知识图谱普遍需要解决的难题。对此,研究者建立了一个连续的向量空间,将知识图谱三元组进行向量化嵌入到其中,从而实现了对实体和关系的分布式表示。现有模型在训练过程中采用生成负样本的方法主要是随机采样,通过此方法生成的大多数负样本质量较差,对于知识表示的健壮性增强并不明显。本文在现有的面向知识图谱的表示学习相关原理和技术的基础上,将现有知识表示模型结合到生成对抗网络中提升模型表现。同时随着机器学习攻击的兴起,模型参数在生产环境中存在着泄露的风险,对系统安全性造成威胁。本文为保护模型安全建立了参数保护机制,并通过优化算法对模型效率进行优化。具体研究内容包含以下几个方面:(1)为了解决Trans系列模型中随机采样生成的负样本质量不高的问题,本文通过对现有的知识表示学习模型的分析,引入了单体表现更好的KB-GAT模型。同时受生成对抗网络的启发,引入KBGAN模型生成较高质量的负样本以提升模型的健壮性。将现有的TransE、TransD模型与KB-GAT相结合,作为生成器和鉴别器不同组合进行试验。结果表明,提出的将KB-GAN与KB-GAT相结合的知识表示框架准确率优于现有的主流单一算法。(2)通过对模型参数篡改攻击相关工作的学习和了解,本文从对模型篡改攻击的防御角度,提出了对于知识图谱表示学习模型KB-GAT的参数保护机制,设计了高效的基于参数关键性的保护框架,根据关键性等级,通过加密验证的方式在系统部署前以及运行过程中对模型参数进行分层校验,确保模型参数没有被篡改从而增强知识图谱的健壮性。最后对实验结果进行分析,证明了保护机制对模型稳定运行的有效性。(3)在实际部署中添加的模型参数保护机制会增加系统的资源和时间开销,需要对其进行约束优化。本文将保护机制转化为一个约束优化问题,建立安全质量模型,同时对KB-GAT保护机制添加执行约束和期限约束,提出了使用果蝇算法(FOA)来获得近似最优解。同时为了解决果蝇算法无法确保获得全局最优解的局限性,使用了对果蝇算法进行多群策略改进的MFOA算法,通过实验评估表明,多群果蝇算法(MFOA)对于提升保护机制效率具有有效性。
其他文献
计算机科学和信息技术等相关领域的蓬勃发展,使各种类型传感器的普及度大大提高的同时,人们对采集不同模态与频段图像的需求也快速增长。单一传感器捕获的场景信息表现出一定程度的局限性,难以满足更多应用的需求。由于不同类型传感器获取的信息之间具有天然互补性,能够在不同应用场景下进行应用。多源图像融合技术旨在将多种不同频段不同模态的图像进行分析整合,从而获得更为全面的成像信息。该领域中最为典型的即是红外与可见
随着云计算的发展,企业将业务移入云端已经成为一种趋势。云计算是一种按需付费的模式,企业不再需要按照传统方式在开发前购置大量物理设备,可将项目整体移入云端,这种方式降低了企业的开发成本和运维成本,同时高了资源的利用率。从整体看,云计算加快了企业信息化的速度,带动了其他行业的增长。目前云产品供商供了各类云相关服务,或借助于云计算带来的优势,开发了相关的轻型应用服务,以满足用户协同办公、云剪辑、云设计等
空间激光通信(Free Space Optical Communication,FSO)需要建立稳定的通信链路来保障通信质量,并且空间中环境复杂多变,因此对通信两端的端机对准程度和通信过程中的实时跟踪性能要求很高。针对这一需求,本文本将主要从激光光斑位置检测和跟踪控制技术两方面入手进行重点研究,来保证FSO的通信链路的稳定,主要工作内容如下:1、首先通过对光通信常用的3种光电探测器进行性能的分析对
1883年,英国科学家雷诺通过圆管实验,发现了流体有着两种不同的流动状态,分别为层流和湍流。从此,人类开启了对流体复杂流态特性的研究。随着对流体力学研究的不断深入,转捩与分离问题逐渐成为近百年来最重要的研究课题之一,也是导致航空飞行器设计不确定性主要来源之一。在日常生活中,转捩与分离现象十分普遍,但其存在的随机性与不确定性和缺失必要逻辑层面的准确定义致使该理论的发展目前尚不成熟。因此,在流体机械的
数值求解含流体双相介质和黏弹性介质中地震波传播方程,并进行波场模拟,对于油气勘探等具有十分重要的理论和实际意义。本文基于Birkhoffian系统,发展了求解双相介质和黏弹性介质中波传播方程的保辛方法。对于描述双相介质中弹性波传播的方程,首先构造了其相应的Birkhoffian系统,以及包含位移和速度梯度信息的广义Birkhoffian系统,然后在此基础上发展了求解弹性波方程的保辛方法(简称SSM
随着现代科学技术的发展,越来越多的科学与工程领域中的问题需要借助科学计算方法来求解。其中许多问题定义在无界区域上,而传统方法并不能有效地求解此类问题,人工边界方法是过去几十年发展起来的求解此类问题的重要方法之一。本文将人工边界方法应用到一类无界区域上的一维常系数电报方程初边值问题。我们首先引入适当的人工边界将问题限定在有限计算区域,随后利用Laplace变换以及一些基本的应用数学技巧,给出了该问题
当今经济全球化、区域间市场一体化的趋势依然没有改变,国际间投资和贸易的交流与合作依然是世界各国促进经济发展最有效的手段之一。中国始终坚持提升对外开放水平,构建良好营商环境,因此在吸引外商投资方面,就必须坚持包容开放的精神,推动投资自由化,促使外商投资能够在中国市场充分发挥其应有的作用,拉动经济持续增长,推动产业转型升级。建立和完善我国的外商投资国家安全审查是为引进外商投资设立底线,使得即能充分利用
胚胎干细胞有独特的能力,能自我更新,无限增殖,并分化或发育成多种类型的细胞和组织。胚胎干细胞应用到临床领域的关键问题是如何从其他类型的细胞中鉴定和分离出ES细胞。作为细胞的“身份证”,特异标志分子在胚胎干细胞识别和确定中发挥了重要作用。本论文中将从噬菌体肽库中筛选出的针对猕猴胚胎干细胞的特异多肽的DNA序列连接到pGEX-KG表达载体上,以便获得GST-peptides融合蛋白。同时,抽提大量培养
1906年1月,李叔同在日本编辑出版了综合性期刊《音乐小杂志》作为中国近代音乐期刊的起步,截至目前我国的音乐期刊发展道路已走过115年。1949年新中国的成立,使我国的社会制度发生了较大变革,文化思潮也随着社会环境的改变有了新的发展方向。上海作为当时国内现代化的城市,奥斯邦将中国第一座广播电台建立在上海并开始播音,这注定上海是近代中国广播事业最发达的城市。《广播歌选》作为曲谱类期刊,以广播为载体,
随着信息技术的发展和人们对生活便利性的追求,大量依靠生物特征构建的识别系统正在逐步取代传统的密钥验证,其中声纹具有特定性和相对稳定性的生物特征,在越来越多的认证系统中被使用。而随着语音合成技术的发展,使得人们可以利用计算机生成与自然人说话语音十分类似的合成语音,这一技术在提高自动语音应答服务质量的同时,也给基于声纹识别的说话人认证系统的安全性带来挑战。犯罪分子可以轻易的获取用户的个人语音信息,通过