论文部分内容阅读
罕见病影响了全球一亿以上的人口,这些患者中大多数无法获得明确的诊断和有效治疗。近年来,随着生物医学研究的持续进展,“精准医学”这一概念渐渐受到生物医学领域研究者的关注。从精准医学的角度来看,作为基础疾病的极端表现,罕见病主要是针对极端少数病例的研究,属于典型精准医学的范畴。因此,研究人员对罕见病的研究越来越向分子化、个体化靠拢。然而,在对罕见病分子机制的研究过程中,由于受到病例稀缺、分布较分散以及数据共享率与可利用率较低等因素的阻碍,传统的基于队列或基于大量临床及分子水平样本的常见疾病分子机制研究方法并不适用于对罕见病的研究。为此,本文提出了基于多组学网络的罕见病分子机制研究方案。该方案旨在通过整合多组学数据建立标准化罕见病知识库,突破当前由于数据量少及知识分散等原因造成的罕见病分子机制研究与临床诊疗困难等问题,并通过知识库中的多组学疾病注释建立疾病网络,探索罕见病的分子机制并预测罕见病潜在致病基因,为阐明罕见病的分子机理及发现潜在的罕见病治疗方法提供新线索。为实现这一方案,本文整合了包含基因组学与表型组学在内的罕见病多组学数据,并通过对MEDLINE数据库中近1000万篇文献的文本挖掘补充了大量罕见病-表型关联,构建了罕见病多组学标准化知识库eRAM(http://www.unimd.org/eram/)。接下来,文章分别基于基因组学、表型组学数据量化了疾病间的关联,建立起不同维度的疾病网络,并详细阐述了疾病网络对疾病分子机制研究、致病基因预测以及临床诊断辅助方面的作用。最后,考虑到基于表型的疾病网络对本身即为表型的复杂疾病进行研究时的不足,文章基于基因本体量化了疾病表型分子功能间的相似性,建立了基于分子功能的表型网络,以帮助对综合症等复杂疾病的分子机制进行研究。