基因本体及其注释数据语义网模型

来源 :华中科技大学 | 被引量 : 3次 | 上传用户:jayzhoujian
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为当前应用最广泛的生物本体,截至2007年8月,基因本体中共包含了大约23,700 条术语,对约20个生物数据库中超过1600 万条的基因和基因产物进行注释。 在语义网应用领域,基因本体协会提供了一个RDF-XML格式文件?(http://archive.Geneontology.org/latest-full/go_200708-assocdb.rdf-xml.gz)。然而该文件存在以下缺点,无法提供复杂的语义查询和推理服务:1)基因本体的三个子本体间是相互孤立的,缺乏必要的跨本体语义联系。2) 文件以基因本体术语为中心进行组织,所有的信息都存放在一个单独的文件中。3) 文件中缺乏对GOSlim的支持。 本文中我们提出了一个语义网模型GORouter。该模型主要论证了如何利用多种基于RDF规范的语义网技术和工具对原始资源重新组织,为用户提供复杂的有关基因本体及其注释数据的语义查询和推理服务。 我们对基因本体协会提供的异构原始数据重新进行编码,构建了一系列的RDF数据模块。GORouter模型中每个RDF模块由两个部分组成:元数据部分采用RSS技术进行标识、数据部分采用LSID 技术进行全球统一命名。 通过采用GLUE系统,我们在三个独立的基因子本体间建立了一对一类型的本体映射关系。为了提高映射精确度,GLUE系统采用“放宽标记”技术获得在给定领域约束和先验知识的条件下最佳的映射配置方案。 我们采用Oracle NDM 作为RDF 存储容器,通过调用SDO_RDF_MATCH 表函数无缝的将RDF 查询结果与传统的关系型数据结合起来。最终,GORouter模型的规模被最小化,那些不直接和语义推理相关的数据将被存储在传统的关系数据表中。 我们相信该解决方案能够部分克服传统语义网应用程序的性能瓶颈问题。 GORouter模型及其应用程序支持Apache 2.0 开放协议,研究人员可以通过访问http://www.scbit.org/gorouter/来获得最新数据和服务。
其他文献
随着能源问题的日趋严重,现代工业中对能源利用率的要求在不断提高,提高管壳式换热设备的传热效率是大势所趋。为了提高管壳式换热器的传热效率,流体的流速越来越高,管壳式换热器
Institutional reform and social changes in northeast China during the late Qing period are usually attributed to the Qing dynasty changing its policy on immigra
该文从理论和试验两方面对活塞式压缩机气垫阀的运动规律进行了研究.该次研究成果有着十分重要的实际意义,它首次提出了较为合理的阀片运动规律方程组,将为气垫阀的制造,以及
学位
心脏病是一种常见的多发慢性疾病,由于病情隐蔽、发展缓慢、发病危险性高,故而成为威胁人类生命的主要疾病。心脏病导致的死亡约有70%是发生在院外的突发事件,对院外高危人群进行
学位
所谓Rayleigh-Benard对流,是以Benard等人在1900年前的实验和Rayleigh在1916年的理论分析而得名,就是在一个封闭的腔体内,底面加热,顶面冷却,从而形成温度差导致腔体内流体运动的流动现象。本文采用大涡数值模拟的方法模拟研究了圆筒内Rayleigh-Benard湍流对流问题,底部和顶部温度恒定,所有壁面都满足速度无滑移条件,并且本文重点研究了侧面冷却下圆筒内Rayleig
制冷型红外探测器由于其灵敏度高、响应速度快、探测器距离远等优点,广泛应用于高端武器装备中。由于应用于军事领域,对制冷型红外探测器组件的体积、重量、降温时间、功耗及
学位
电容层析成像(简称ECT)是20世纪80年代中期出现的一种新型的多相流检测技术,利用这种技术可以通过测量容器表面分布的电极对之间的电容值,采取相应的算法获得容器内部的介质分