基于知识表示学习的领域本体辅助构建研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:sky007
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为完成多种不同类型的任务,研究人员创建出该相关知识领域的知识库,然而,不同知识库中的数据,表现出结构松散、多源异构的特点。为解决此问题,研究人员开始针对特定领域,创建出满足结构化描述该相关领域概念的方法——“本体”。创建领域本体,其过程极其复杂,在此过程中,不仅需要各种方法的交替使用,更加需要人力资源的参与,为对其过程进行一定的优化,本文的目的在于使用相关的自动学习的方法在领域本体被创建时,针对其过程中的某一特定环节,进行一定的辅助作用。其具体任务为:给定领域知识库,在领域本体创建过程中,利用相关的自动化方法,辅助本体构建过程中的实体到相应概念类的映射,即对实体进行聚类操作。针对此任务,本研究对从Sem Med DB知识库所提取的数据进行处理,使用多跳策略完成相应的实体匹配,并通过三元组过滤构造出针对糖尿病领域的知识库。基于此知识库进行实验,对比研究本文所用模型的有效性。完成本研究中的辅助构建要求,关键在于如何对知识库中的数据——实体,进行有效的表示,而本研究中的知识库的组织形式为知识图谱,其表现为多关系图。因此,本研究中,分别利用知识表示学习中的Trans X翻译模型、Rotat E等复杂空间模型进行实体的特征表示,并提出直接关系模型从知识库中的关系语义空间进行实体的特征表示,之后进一步利用直接关系和知识表示学习的融合模型对糖尿病领域知识库中的实体进行特征表示,利用其完成本体创建过程中实体的聚类任务。本研究中使用标准互信息和轮廓系数这两种指标对聚类结果进行测评,同时利用可视化工具将模型学习到的实体特征向量以及聚类效果进行展示分析。实验结果表明,利用直接关系和知识表示学习的融合模型可以在研究中获取到最好效果,其中:NMI值达到0.503,Mean S值达到0.475。说明通过直接关系和知识表示学习融合模型进行实体的特征学习,其结果可以帮助领域专家在本体创建过程中对概念的归纳工作。
其他文献
电化学分析以其灵敏度高和便捷准确而成为分析检测领域的研究热点之一。本论文制备了还原氧化石墨烯修饰的玻碳电极(rGO/GCE)、平面参比电极和纳米普鲁士蓝、氧化石墨烯及双三
棉麻混纺纱结合了棉纤维和麻纤维的优良特性,制成的织物手感舒适,吸湿透气性好,因此备受广大消费者的喜爱。棉麻混纺比的测定是非常重要的一个指标,由于棉麻纤维同属于纤维素
随着经济的发展,每个家庭都会产生剩菜剩饭,如果再次食用,食物产生的亚硝酸盐对人体造成危害,若跟随生活垃圾一起处理,食物垃圾分解会产生有毒有害物质污染环境。为了营造提
本文以矿物棉和芳纶纤维作为无石棉垫片的主要材料,设计配方并作为载体,对其工艺参数深入研究,旨在探究工艺参数与性能的关系,揭示其影响机理,优化工艺参数,为实现性能优良无
交通目标检测是实现无人驾驶的重点也是难点,其准确性和实时性是评价检测系统的重要指标。目前基于深度学习技术的应用系统主要部署在云端服务器,网络环境极大影响系统响应速
通用目标检测一直是计算机视觉和数字图像处理中最为基础和最具挑战性的问题之一,在自动驾驶、人脸识别、图像检索和工业检测等领域都具有广泛的应用前景。传统的通用目标检
我国是具有悠久历史文化的文明古国,先后历经八十多个王朝,考古学家可以根据各个历史时期遗留下来的文物对该时期的经济文化进行研究考证。辽金时期人们崇尚信奉佛教,将佛教
作为特种工程塑料之一,聚酰亚胺由于其优异的热稳定性、突出的机械强度、良好的介电性能、优异的尺寸稳定性和阻燃性等而备受人们的青睐。芳香族聚酰亚胺由于其优异的热稳定
肿瘤转移作为癌症患者最大的敌人,在基础及临床研究领域始终是热点之一。近来研究表明,新生血管在肿瘤转移的过程中起到了至关重要的作用:肿瘤组织由于肆意生长而需要大量的
逆合成孔径雷达(ISAR)成像是一种重要的动目标高分辨成像技术,被广泛应用在军事和民用领域。随着目标自动识别技术的发展,ISAR获取的高分辨图像往往作为识别系统的输入,用于