知识图谱中实体画像方法研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:wyzxfjjx
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱是描述真实网络世界中实体事实的图结构知识库,随着互联网数据日益激增,知识图谱中实体的描述变得越来越复杂和冗长。用户在使用知识图谱时,容易迷失在海量实体信息中,区分和比较实体变得越来越困难。知识图谱中实体画像工作的研究目标,是寻找实体间最具有区分度的结构化特征为实体画像,帮助用户较快的区分比较同类型下多个实体。目前尚未有专门的工作对知识图谱中实体画像方法进行研究,本文提出一种基于结构化标签的实体画像方法,通过画像结果精简实体原本繁杂的描述信息,解决知识图谱中实体信息过载和实体理解困难的问题。论文主要研究工作如下:(1)提出了一种知识图谱中构建实体结构化标签集合的方法。通过分析知识图谱中实体复杂的关系以及属性描述,借助统计推断、启发式规则过滤、结构化标签度量排序等技术手段,自动构建用于实体画像的结构化标签集合。(2)提出了一种度量结构化标签区分度的方法。本文提出的结构化标签区分度计算公式,定量刻画结构化标签区别实体的能力,用于排序生成区分实体能力较高的结构化标签集合。同时提出三种实体相似度计算方法,用于结构化标签区分度公式计算,包括基于朴素SimRank的实体相似度计算、基于蒙特卡罗估计的SimRank实体相似度计算以及基于网络表示学习的实体相似度计算。(3)通过设计相关实验评估了本文提出的基于结构化标签的实体画像方法。实验结果验证了本文提出的结构化标签度量方法的可行性与通用性,以及实体画像结果的合理性,并对实体画像结果进行可视化展示。在实际常用数据集上的实验表明,本文提出的基于结构化标签的实体画像方法是有效的,能较好帮助人们对知识图谱中的实体进行理解和区分,为促进知识图谱中实体理解工作提供了一种新思路与方法,具有一定的研究和应用价值。
其他文献
本文综述了荧光寿命成象显微技术的概念,原理及实现方法、介绍了荧光寿命成象显微 生物物理、生物化学及临床医学诊断等领域的最新研究成果和发展现状,并就其未来的发展及应用
粘弹性阻尼材料是当前生产生活中阻尼结构件的主要组成部分,此类材料的应用使得阻尼形式多样化、应用领域更加广泛、减振降噪效果更显著。近年来对于橡胶基阻尼材料的研究比
目前国内高速公路服务行业已经意识到高速公路客户满意度评价能提升高速公路服务质量,而服务区作为高速公路服务的主要载体,服务区服务满意度的高低直接影响到对高速公路整体满意度的评价。满意度作为出行者心理潜变量因素影响着出行者的出行选择行为,研究服务区服务满意度的影响机理,并进一步分析出行者心理感知因素对服务区选择决策的影响,有利于提升服务区服务质量水平和服务区驶入率。基于此,本论文开展了以下几个方面的研
[目 的]在BIS监测下研究依托咪醋在不同程度烧伤患者体内的药代动力学,从而指导临床用药。[方 法]选取2017年6月至2017年9月在昆明医科大学第二附属医院入住烧伤科接受择期全
目的:调查研究常州市区小学游泳校本课程开发现状,为游泳校本课程在学校体育中的开发和实施,提供借鉴与参考。方法:采用文献法、调查法、个案研究法等对常州市区小学游泳校本
生石灰是白色粉末状的无机化合物,因其良好的水稳定性、冰冻稳定性、适用的广泛性、操作简单和经济性,广泛用于改良黄土,有极好的效果。本文对兰州地区的马兰黄土作生石灰处
保障高校党员发展质量对高校党建工作的开展有着十分重要的意义,但从浙江财经大学的现实情况来看,党员发展过程中尚存在一些影响党员发展质量的问题,如入党动机不够纯正呈多
随着UPVC(硬聚氯乙烯)管不断替代镀锌管和铸铁管的成功,管道渗漏的通病得到了控制.为此,根据施工实践,从材料、工艺要求等方面总结了几项施工要素,列举了UPVC管推广使用中必
从去年底召开的全国铁路工作会议上获悉:2005年铁路基本建设投资规模超过1000亿元,大规模铁路建设将全面展开。
北京将再投资300亿元,全面加快交通体系建设。目前,北京除有一批市主、次干线道路建设正启动外,现有5条快速联络线正在抓紧建设。届时,它们将与二、三、四、五环路等其它10条快速