知识图谱的数据清理和应用探索

来源 :复旦大学 | 被引量 : 0次 | 上传用户:xiaoxiao_666
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
知识图谱与知识库在很多类型的应用中被广泛使用,例如语义网络,机器翻译,查询扩展,文本分类等。此外,分类知识库也在数据清理,实体解析,信息集成领域扮演着重要的角色。随着知识图谱中实体与关系规模的持续增长,一方面知识图谱本身可能存在着数据质量问题,另一方面,如何对海量数据进行存储、应用是对知识图谱研究的一个巨大挑战。针对上述挑战,本文研究了知识图谱上的数据清理问题并且对知识图谱的存储、应用做了一定程度的探索。本文工作分为两大块:首先针对大规模实体网络中数据清理的挑战,通过分析知识图谱,我们发现在大规模知识图谱中存在着“孤儿概念”这样的数据问题。本文中就此问题提出了首先基于统计实验的算法来找到这些存在问题的概念实体,并且通过一系列自然语言与机器学习的方法为这些存在问题的概念实体进行清理。实验证明,我们基于统计实验的算法的确可以找到“孤儿概念”并且可以有效的进行清理,从而增加了知识图谱的准确性。而后对于本文对大规模网络存储以及应用进行了探索,利用了重新为顶点排序的思想在生物数据集上进行了实验,证实了压缩存储的算法的确有效。其次在应用探索中,我们对XML配置文件中的XML属性值推荐这一场景进行了如何将融入知识图谱的探索。我们发现,通过知识图谱上的语义信息,我们可以更准确地为开发人员推荐XML配置文件中的属性值,从而为软件工程师提供更加便捷的开发工具,帮助他们更好的进行应用开发。
其他文献
目的 观察早产儿喂养不耐受的护理干预效果.方法 选取我院自2018年4月至2019年4月收治的78例喂养不耐受早产儿,随机分为观察组(39例)与对照组(39例),给予对照组患儿常规护理
目的 探讨综合护理联合心理护理干预在ICU脑出血患者护理中的应用效果.方法 抽取2017年1月至2019年1月来我院ICU治疗的脑出血患者50例,随机平均分为两组,分别给予常规护理干
目的 评价阴道炎患者应用臭氧液阴道冲洗配合护理干预模式的效果.方法 选取我院2019年4月至2020年4月收治的460例阴道炎患者随机分为两组,并按照入院顺序随机将其分为对照组
目的 探讨分析上颌窦内外提升种植牙围手术期的临床护理措施.方法 收集整理我院2014年1月至2018年12月收治的180例上颌窦内外提升种植牙围手术期患者的临床资料,将其作为本次
进入三季度以来,兖州矿业集团唐村实业公司在全公司范围内广泛开展了以“战高温、斗雨季、创水平、夺高产、保安全”为内容的夏季“百日安全生产”活动。党政工三家同唱一台
P2P技术是目前网络计算研究领域的热点问题之一,其中基于P2P的分布式计算也日益受到人们的关注。JXTA技术是一套开放、通用的P2P协议,独立于编程语言和系统平台,可以作为P2P
刚刚开学没几天,我去图书馆查找资料,偶然相识了《新闻与写作》(2008年第7期),留给我的第一印象非常深刻。特别是“应用文写 Just a few days after I started school, I we
  本文在描述办公自动化发展历史及我国发展的现状基础上,结合某税务局的办公自动化现状,针对其办公特点及前期业务需求与工作流程,在充分了解WFMC参考模型及相关基本概念、群
目的 探讨观察在急诊中对有机磷中毒患者应用急救护理流程和自我防护措施的临床效果评价.方法 整理我院于2018年1月至2019年8月收治的有机磷中毒急诊患者100例的临床资料,根
目的 观察分析饮食依从性与护理干预对慢性肾功能衰竭患者的影响.方法 将我院2018年5月至2019年5月收治的慢性肾功能衰竭患者90例以随机数字表法分组,观察组与对照组各45例,