论文部分内容阅读
全基因组关联研究(Genome-wide association studies,GWAS)已经被广泛的应用到识别炎症性肠病(Inflammatory Bowel Disease,IBD)相关的单核苷酸多态性(single nucleotide polymorphisms,SNPs),与IBD相关的GWAS主要包括研究与溃疡性结肠炎(Ulcerative Colitis,UC)和克罗恩病(Crohn’s Disease,CD)关联的SNPs以及研究与这两个疾病都关联的SNPs。目前为止,GWAS已经识别了超过200个基因位点和这两个疾病相关联。但是这些位点却只能解释这两个疾病遗传度中很少的一部分。要想从遗传角度更好的了解这两个疾病,就必须识别出更多与这两个疾病相关联的遗传变异位点,这就需要利用更加高效的数据分析方法,从现有的GWAS数据中挖掘出更多的信息,帮助我们更好地去了解这两个疾病。研究目的:利用高效的统计分析方法对IBD相关的GWAS数据进行二次挖掘,识别更多与UC和CD想关联的遗传变异位点。研究方法:使用的数据集是从国际炎症性肠病遗传学联合会官网上下载的炎症性肠病(Inflammatory Bowel Disease,IBD)的GWAS汇总数据(其中,UC相关的GWAS meta汇总数据涉及20,464个对照和6,968个病例;CD相关的GWAS meta汇总数据涉及14,927个对照和5,956个病例)。首先利用分层条件Q-Q图和对应的条件真实发现率图,评估这两个疾病之间遗传多效性富集程度;再利用已经被广泛应用的条件错误发现率(conditional false discovery rate,cFDR)分析方法和联合的条件错误发现率(Conjunction cFDR,ccFDR)分析方法,计算每一个SNP对应的cFDR和ccFDR,同时对SNP进行染色体位置和所在基因进行标注;最后利用基因功能注释和通路分析来判断识别的位点所被标注的基因富集在哪些功能类群和代谢通路。结果:1.分层条件Q-Q图和对应的条件真实发现率图,表明在UC和CD之间存在很强的遗传多效性富集现象;2.利用cFDR方法,选择cFDR<0.01为显著性阈值,一共识别了130个遗传位点和UC相关联,其中有43个位点是新发现的,识别了174个遗传位点和CD相关联,其中有86个位点是新发现的;3.为了识别与UC和CD都关联的遗传位点,以ccFDR<0.01为显著性阈值,一共识别了75个遗传多效性位点,其中有22个位点是新发现的。结论:cFDR方法在IBD相关GWAS汇总数据二次挖掘的成功应用,识别出了较多新的SNPs与UC和CD相关联,也识别出一些与UC和CD都关联的SNPs,进一步说明UC和CD之间存在很强的多效性富集现象,表明两者之间存在某些潜在的共同遗传机制。这些结果为研究UC和CD的致病机制提供了新的线索,加深了对这两个疾病之间共同的治病机制的理解。