面向服务精准推荐的知识图谱补全技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:fuuxia
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的蓬勃发展,不同的服务开始相互融合或协同,逐渐形成服务的生态系统——服务互联网。为了深入研究它的组织结构与演化方式,以基于多层网络的服务生态模型为本体层,构建了服务互联网知识图谱。然而,服务互联网知识图谱数据源格式的多样性和数据源之间较少的关联,导致服务互联网知识图谱并不完整,大量实体存在属性缺失问题。因此,本文的核心任务就是为知识图谱补充知识,从而提高知识图谱的质量,为知识图谱的下游应用提供坚实基础。围绕上述问题与任务,本文将从以下几个方面进行研究:(1)针对服务互联网知识图谱中的属性缺失问题,提出基于Word2Vec的属性补全方法。为了减少属性值逻辑规则和监督数据的需要,以外部结构化文本数据作为补全依据,结合知识图谱本体层中各个实体类型的属性集合与基于Word2Vec词向量的属性相似度判断方法,得到合适的属性三元组,从而补全知识图谱属性。最终,以服务互联网知识图谱的数据为例,验证了该方法的有效性。(2)针对服务互联网知识图谱的不完整问题,提出基于四元数空间投影和BERT的关系补全方法。先学习知识图谱信息,再利用链接预测任务为知识图谱添加新的链接。一方面,为了深入研究知识图谱嵌入方法,分析了Trans D与Quat E两种方法的思想,将投影引入到四元数空间,以此建模并学习知识图谱蕴含的结构化信息;另一方面,为了使方法能够学习语境信息且具有普适性,利用BERT模型学习实体文本和关系文本中携带的语境化信息与结构化信息。实验表明,上述两个方法均可以得到新的链接,在数据充足的情况下前者会有比较好的效果。(3)为了验证知识图谱补全方法对知识图谱质量的改善,考虑知识图谱的实际应用价值,以服务推荐间接评估知识图谱质量。采用基于知识图谱的服务推荐方法——知识图谱注意力网络推荐模型,通过对比知识图谱补全前后的推荐效果得到知识图谱补全方法对知识图谱质量的提升。实验结果表明,补全后的知识图谱加强了推荐效果,提高了知识图谱质量,从而验证了补全方法的有效性。(4)为了将上述知识图谱补全方法应用到其它知识图谱,本文设计实现了面向KGC的知识图谱管理平台,向用户提供知识图谱构建与补全服务。
其他文献
无线Mesh网络(Wireless Mesh Network,WMN)是一种多跳网络,具有组网灵活、网络覆盖率高等特点。信道分配与路由协议的优化,均能提高网络性能,是WMN中两个至关重要的研究内容。在多接口多信道无线Mesh网络中,节点接口数量和信道数量通常是不等的,因此本文将解决在满足网络连通的情况下实现负载均衡,同时考虑信道切换过于频繁导致网络效率和吞吐量的下降问题。路由协议方面,由于传统路由
学位
现如今,各个领域中的传感器、信号捕捉器等每时每刻都在捕捉时间序列数据,时间序列数据呈爆炸式增长。随着数据量的不断增长,时序数据库应运而生。在时序数据库中,数据压缩是其中最重要的组件之一,直接关系到存储和查询的效率。然而现有的时序数据库压缩算法面临着很多问题,比如在压缩数据的压缩比上表现不够好,不能适应大规模数据存储需求;数据压缩方案的灵活性差,不能一直保持良好的压缩比,不同领域的数据和不同数据模式
学位
随着科技的不断进步和发展,产生了越来越多的文本数据,对于文本数据的处理已经是大势所趋。近年来,文本数据分类技术迅速发展,面对海量新闻数据和舆情数据等其他文本数据的增多,文本分类方法也在不断创新。然而不同的文本数据在结构上存在很大差异,并且海量文本数据中会存在丢失和语义不完整的情况。文本数据具有语义表达不清楚、维度较高、数据内容稀疏的特点。传统的文本分类方法往往从词频方向考虑,而不考虑语义方面,使得
学位
当前社会经济发展的同时环境问题更加突出,工业、采矿业等的发展带来严重的环境污染。多环芳烃(PAHs)是有机污染物中的典型代表之一,可以造成土壤污染,大量农作物减产,危害人类健康。因此,PAHs对植物生理机制的影响已成为生态学研究热点之一。苯并芘(Benzopyrene,B[a]P)是PAHs中毒性最大的强烈致癌物,其化学性质稳定,广泛存在于水、土壤、大气中,对动物的内脏器官和神经系统造成严重损伤,
学位
生物多样性是地球生命的基础,也是人类社会赖以生存和发展的基础。正确认识河流生物多样性特征及规律,可以为河流生境改善及河流生态修复工作提供强有力的支持,具有重要的现实意义。本研究采用现场调查与实验室分析相结合的方法,开展了辽河流域植物多样性、浮游生物多样性和脊椎动物多样性调查研究,并对其分布规律进行了分析,为辽河流域生态功能恢复与生物多样性保护提供科技及数据支撑。辽河流域植物多样性调查研究结果表明:
学位
控制力矩陀螺(Control Moment Gyro,CMG)是现代航天器用于姿态机动控制的重要设备,具有耗能低、输出力矩大、精度高等优点,其健康状态和可靠性直接影响航天器的在轨寿命。CMG的各部件监测数据随航天器的在轨遥测数据下传,存在数据采样率低、数据丢失和数据高延迟导致实时性差等问题。近年来,随着航天数据的大量积累和神经网络技术的发展,利用神经网络进行时间序列数据插补成为研究的热点之一。数据
学位
氧氟沙星具有良好的抗菌效果和更低的副作用,被广泛应用于杀菌和抗感染,因此产生了大量的含有氧氟沙星的废水。如果未经处理或处理不完全的氧氟沙星废水流入环境中,会对生态系统和人体健康构成威胁。目前已经有很多方法处理氧氟沙星废水,但是由于氧氟沙星具有低生物吸收性和难降解性,导致传统的方式不能有效的降解氧氟沙星。所以,探索一种高效绿色的处理氧氟沙星废水的方法至关重要。使用Ti O2的光催化降解有机物作为一种
学位
心血管疾病已经成为全球死亡原因的首位原因,因此使用医学影像技术全面准确地评估心脏功能和运动状况具有重要意义。心脏磁共振成像是心功能量化评估的金标准,近年来出现了一些能从磁共振成像中进行心功能定量分析的专业软件,如CVI 42等,但仍存在以下不足:(1)分割阶段需手动勾勒心肌内外膜轮廓,繁琐且耗时;(2)多用传统算法进行心肌运动跟踪,反复迭代优化导致效率较低下;(3)此类软件多为商业软件,费用高昂且
学位
近年来,深度强化学习技术在各个领域广泛应用,为了增强其泛化能力提出了多目标强化学习算法,然而多目标强化学习算法仍然面临着大多数强化学习算法都会遇到的稀疏奖励问题,算法在稀疏奖励环境下难以获得有效的奖励,样本利用效率非常低。HER(Hindsight Experience Replay)算法的提出从失败样本中获取经验,一定程度上提高了样本利用率。为了进一步提高样本利用效率,本文将HER算法重标记得到
学位
四环素排放到环境中对生态环境带来潜在危害。吸附法成本低且处理效果好,可应用于四环素的去除。在吸附剂中,蒙脱土和凹凸棒土是分布广泛的天然粘土矿物吸附材料,两者阳离子交换量大、具有较大的比表面积。然而,由于粘土矿物层间表面的亲水性,其对疏水有机化合物的吸附能力受到限制。将天然矿物进行铁改性可使得材料与四环素发生络合反应,进而提高吸附剂的吸附效能,实现有机污染物的高效吸附,但吸附饱和了有机污染物的吸附剂
学位