基于多组学数据的本体注释与知识图谱构建方法研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:bloodsteven
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着测序技术的不断发展,测序费用逐年降低,各国相继发展了大规模精准医疗计划。随着这些大规模精准医疗计划的实施,相关的生物数据呈爆炸式增长。当前对于如何管理和分析海量的生物变异数据是目前生物信息学研究人员面临的巨大难题之一。虽然有不少基于变异数据的管理软件,但是大部分没有与本体数据结合,然而这些本体信息数据在疾病研究、分子诊断上有着不可忽视的作用。精准医疗计划的实施离不开复杂性疾病的研究。复杂性疾病是由基因或环境等多领域因素导致的疾病。在治疗复杂性疾病时,单一组学数据的分析往往是不够的,而是需要基于多组学知识进行全方位的理解。然而这些组学数据往往存储在不同的数据库中,给生物医学工作者来了极大的不便。因此基于多组学数据对变异文件进行本体注释,构建多组学知识图谱是未来生物医学领域重要课题之一。本文主要研究成果如下:(1)研究了测序分析工作流与本体注释方法。本文选择较流行的比对和变异检测软件搭配,完成了DNA二代、DNA三代和RNA测序。并基于检测的变异文件,开发了本体注释方法,通过该方法可以将本体信息注释到变异文件上,在一个文件上整合多个数据库,极大的提高了查询效率。(2)搭建了多组学知识图谱与基于知识图谱的语义检索模型。通过先构建数据模式层,然后基于数据模式层建立多组学知识图谱。目前该图谱包含30多万个节点,600多万个关系。最后基于知识图谱构建了语义搜索模型,用以满足用户的语义搜索需求。(3)建立了变异管理与多组学知识图谱集成平台。并包含了基于知识图谱的语义搜索模型。平台采用B/S架构,后端使用Mongo DB和Neo4j两种数据库。前端采用WEB界面,满足用户的变异管理需求和多组学语义搜索需求,方便用户使用。
其他文献
在动趋式结构中,“来/去(基本义)”作为趋向补语与宾语共现的语序问题是留学生学习趋向补语时的难点之一,本文试图以传统语法描写式研究为基础,从语法、语用、认知等角度对“
据相关实践表明,节水灌溉能使农业用水的利用效率和单位农作物收益有效提高,同时对农业设施的完善极为有利,可以使社会和经济效益得到极大提高。现阶段,我国节水灌溉面积以一
  通过对国内四个生活垃圾焚烧发电工程的调试介绍,阐述对调试工作进度的编排和烘炉、焚烧配风技术、尾部烟气处理等调试技术要点的掌握提出了见解,对进一步提高垃圾焚烧调
湘军集团与理学文化有着深层次的互动关系。咸同湘军兴起,不仅是宏济艰难的现实选择,更是儒学内部结构运动的结果,是理学自救的产物。湘军是一支以文化立军,有着自身政治目标
乡镇农村经营管理(以下简称'乡镇农经管理')是农村经营管理体系的最基层,对将国家农业农村发展政策贯彻落实到实处具有'最后一公里'的关键作用。然而,一段时
随着移动技术的发展和智能手机、平板电脑等的普及,移动学习开始成为教育教学研究的热点。以"带传动"教学案例为例,运用蓝墨云班课APP,尝试了"翻转课堂"教学模式在中职机电专
国外军事人员使用膳食补充剂比例较高,且一直处于增长状态。不同军种使用膳食补充剂比例、品种差异较大,处于部署任务的士兵大剂量使用氨基酸和蛋白质,部分人员使用含兴奋剂
通过解读卢卡奇的物化理论,我们可以看出,资本主义社会是一个全面物化的社会,物化现象深入到经济、政治和文化领域中。人在这种物化现象下出现了畸形发展,使得人在社会生活中完全
种植体表面形貌可以有效地改善骨整合,其中巨噬细胞在成骨过程中发挥着不可或缺的作用。巨噬细胞在不同的局部微环境中以不同的形式极化(促炎型M1或抗炎型M2)。极化方向决定骨
猪繁殖与呼吸综合征(Porcine reproductive and respiratory syndrome,PRRS)是由PRRSV引起猪的一种高度接触性传染病,主要引起母猪的繁殖障碍和仔猪的急性发病死亡,对养猪业