大规模生物医学语义关联数据集的查询关键技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:zhumuray
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,大规模语义数据Linked Data数据量呈现爆炸式的增长,其中生物医学数据集占据了相当大的比例。由于这些数据集分散且仅提供了有限的查询功能,没有充分出挖掘数据集中的有效信息,给用户提供一套综合的应用方案。因此,将RDF语义和生物学意义结合起来,研究其语义查询问题有着重要的理论意义和工程应用价值。在详细分析DBpedia、SIDER、Diseasome、DailyMed和LinkedCT等11个数据集的基础上,研究开发了一个具有生物学意义的多数据集语义查询平台。为了保证RDF语义数据的一致性,设计基于MapReduce的不一致检验算法,对跨领域核心枢纽数据集DBpedia进行验证,得出不一致检验结果并给出解决方案;设计数据集关系挖掘算法,绘制出数据集关系图;通过对数据集之间关系的分析,提出了三种语义查询问题:查询疾病信息、根据疾病查询药物和查询药物副作用;以Cassandra作为底层储存库,在分布式条件下采用MapReduce方法完成数据的装载;采用路径查询理论给出了三种查询功能的算法设计和实现,实例查询结果展示了平台的有效性和优越性。基于大规模生物医学语义关联数据集研究开发的语义查询平台,充分利用了语义Web相关技术,并与生物学意义相结合,为用户提供了一个实用且有效的查询平台,同时对于智能问题回答系统的构建也有一定的指导意义。
其他文献
虚拟化技术的出现改变了管理计算机操作系统、存储以及应用程序的方式,它提供了共享物理资源的能力,使得物理资源能够在同一时间内被多个不同的虚拟机使用,消除了操作系统对物理
随着我国科技计划项目申报数量和经费的逐年递增,项目重复申报现象日益突出,人工形式审查难以有效解决项目查重问题。论文针对科技项目申请书的特征,主要研究项目申请书关键词提
温室控制技术正在不断突破,智能温室已成为温室控制新的发展阶段,在设施农业方面智能温室具有十分显著的典型性和代表性。本文在查阅了大量国内外温室控制材料基础上,首先对
随着现代信息技术的迅猛发展,计算机技术在各行各业中的应用日益广泛和深入,使计算机管理变得特别流行和重要。随着教育部一系列关于精品课程建设重要文件的下发,全国各高校
近年来,目标跟踪在计算机视觉领域扮演着非常重要的角色,同时也是其研究热点。随着目标跟踪技术的不断发展,它在各种各样实际的应用中都发挥着至关重要的作用。因此,各种目标
多示例学习概念是上世纪90年代由Dietterich等人在研究药物活性预测问题时提出的。在多示例学习模型中,训练样本的类别标记歧义性不同于传统机器学习模型,使得多示例学习成为一
脑-机接口是一种不依赖于脑的正常输出通路的新型脑-机通讯系统。它的一个重要用途是为那些思维正常但是中枢神经系统严重受损的闭锁病人提供语言交流和外界交互。该技术由于
高维多目标优化是指对目标个数大于三的多目标优化问题进行优化。大多数传统的多目标进化算法,如NSGA-II和SPEA2,采用Pareto支配关系指导搜索;同时采用各种分布性保持策略作为算
近年来,由于软件开发的规模和复杂度日益提升,传统的软件开发方式已难以应对在需求频繁变更的环境下进行软件开发的实际需求。在软件工程领域引入软件产品线技术,可以帮助实现软
改革开发以来,我国物流业飞速的发展,为我国创造了巨大的社会效益。但是与物流技术发达国家相比,我国物流技术发展落后,企业信息化程度低,从而导致了我国物流的成本远远高于发达国