基于领域本体的生物医学本体匹配算法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:never0005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本体,这个概念起源于哲学,在计算机科学与信息科学领域,因为它对知识工程中的很多问题有很大的帮助,所以在最近几年,有着很大的发展。生物医学领域,近几年也在飞速发展,而本体也由于其结构化的特点,在这一领域也得到了很大范围的应用。并且越来越多的组织,机构,研究人员也构建了很多的本体来方便其研究工作,但是也因为构建本体的标准不够统一,不同的构建方法得到的本体可能有很大的不同,所以对同一个事物构建出来的本体可能存在不同形式上的异构,对这些异构的本体进行匹配,将他们映射整合起来,就有着相当重要的意义。不仅如此,在非同源的生物医学本体上进行的匹配整合在疾病预测方面也有着很大的意义。而将两个本体进行整合,其中最重要的步骤就是本体匹配,这一步骤就是将两个不同本体中的概念和关系通过各种方法得到相应的相似度,然后根据这些相似度,根据各自的权重相加,然后对结果进行筛选,得到概念和关系之间的映射。在本文中,主要针对生物医学本体的特点,提出了利用生物医学领域本体的同义词与外部映射关系的信息,发现更多概念与概念之间的相似关系。同时,针对生物医学本体中命名相对规范的特点,对不同单词的词频进行了统计,同时根据词频对不同单词的权重进行了修改,从而减少了由限定语过长而导致的错误匹配。其次,根据生物医学领域有大量的疾病实验数据,通过将本体与这些疾病实验数据之间建立关联,可以根据这些疾病数据找到更多概念与概念之间的信息,从而能够发现更多的相似关系。最后对权重进行了调整,将相对重要的文本及外部资源的相似度调高。最后对得到的结果进行筛选。在得到本体之间的匹配映射关系之后,下一步就是对本体进行整合,如果一个应用要使用到不同的本体,可以直接通过他们之间的关联信息建立沟通关系,从而达到进行操作的目的,但是这样也会带来一些不便,所以通过将本体整合成一个本体可以很好的解决这些问题,所以本文的最后一部分讨论如何通过已有两个本体的信息和本体的映射信息来建立出这两个本体的整合本体。最后,根据已进行的研究,开发出了对本体进行整合的工具,可以通过输入两个异构的同源本体,输出一个整合之后的本体,或者通过输入两个不同源但是同类型的本体,输出将这两个本体整合后的本体及其映射关系。
其他文献
网络的拓扑结构是计算机网络的重要特征之一。拓扑发现就是发现网络元素并确定网络元素之间的物理或逻辑连接关系,确定网络的拓扑结构,包括互连设备如路由器、网桥、交换机、
随着网络的普及,网络蠕虫的快速传播成为网络系统安全的重要威胁。蠕虫通常使用网络扫描功能来探测远程或本地主机的信息,这种异常扫描是网络蠕虫传播的前提条件。针对免疫学
近些年很多文章致力于融合各种细分方法,有三角网格四边网格细分的融合,有点分裂型细分面分裂型细分的融合等等,然而仍然没有一种统一的形式来表示插值型细分和逼近型细分的融合
数字校园是指利用多媒体、网络等信息技术,将学校的主要信息资源数字化,并实现数字化的信息管理方式和沟通传播方式,从而形成高度信息化的人才培养环境和科研环境。数字校园
基于群签名的安全数据访问技术,是一种以群签名体制为身份验证手段,可实现用户以匿名方式访问数据,同时可验证用户有效身份的安全数据访问技术。本文以Ateniese等人提出的ACJ
随着对外交流,引进先进技术的增加,人们接触专利文献的机会越来越多。从事科技翻译的人员经常要遇到专利文献的翻译问题。而术语翻译尤其是专利文献翻译的一个重要部分。近年
现有基于Petri网、Agent等技术的多媒体同步模型,均使用单一的同步尺度,难以解决流内同步和流间同步的矛盾。选择对象粒度太小,有利于保持流间同步,但会破坏流内同步,即造成
学位
随着信息时代的到来和计算机网络技术的飞速发展,分布式环境日益普遍,而传统的集中式数据挖掘技术无法解决分布式下的挖掘问题,故在分布式下如何进行有效的数据挖掘成为当今
近年来,随着互联网和各种信息交互平台的大力发展,现实世界中的个体在不同的网络虚拟空间中形成了多种多样的社会网络。其中,各种交流论坛收集了丰富的用户个人信息,用户之间