基于折叠算法的复杂疾病稀有变异全基因组关联分析

来源 :哈尔滨医科大学 | 被引量 : 0次 | 上传用户:temp1229
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,研究基因组上序列的变异(或多态性位点)与疾病的关系成为揭示复杂疾病遗传机制的关键步骤。全基因组关联分析方法已经取得了显著的成效。随着二代测序技术的发展和1000人基因组计划的进行,人们又发现了大量的稀有变异,共同对疾病的产生起着至关重要的作用。然而对于稀有变异的序列层面的研究却相对比较滞后,主要原因在于现有统计方法在研究稀有变异时的无效性。鉴于此,近年人们不断探索开发出了不少相应的方法,其中重要的思想就是将稀有变异按照一定的功能区域进行折叠,进而加大其在群体中的频数以适应传统统计方法的需要。   本研究从稀有变异风险位点挖掘的折叠算法出发,将研究稀有变异的思想应用于所有风险变异位点,希望结合现有的染色体功能保守区域,如基因、基因外显子区域、子通路以及GO功能节点等,将序列谱和功能区域结合在一起,更好的寻找疾病相关的风险区域。折叠后获得的“虚拟谱”信息既包含了功能信息又包含了序列信息,然后通过全基因组关联分析(GWAS)挖掘与疾病显著关联的染色体区域。基于统计模型的效能和稳健性,我们选取Pearson卡方检验和Cochran-Armitage趋势检验进行全基因组关联分析。   我们将上述方法应用于GAW国际会议提供的类风湿性关节炎数据。利用折叠算法,我们以所有已知的编码和非编码基因作为折叠的染色体功能区段与其上包含的SNPs信息融合,利用GWAS方法,找到与疾病关联的风险基因59个(SNPs位于基因上下游5kb之内)和94个(SNPs位于基因上下游1kb之内),其中有效的识别了部分已有文献证实与类风湿性关节炎疾病相关的基因,如HLA-DRA和HLA-DQA1等。令人感兴趣的是,由于我们选取的基因包含非编码区域,因此在风险基因的挖掘结果中恰好都包含了2个miRNA:miR877和miR219-1。随后,结合TargetScan数据库的靶基因信息和Transfac数据库的转录因子信息,我们构建了风险基因、miRNA及其靶基因、转录因子之间的互作关系网络,尝试结合转录因子进一步探索基因与疾病的关系。选取的基因-SNPs距离为1kb范围时,我们构建的调控网络中除了miR877和miR219之外,还有HLA-DRA、HLA-G、IFITM1和C4B几个风险基因编码转录因子或者被转录因子调控,并且文献已经证实它们在类风湿性关节炎发生发展过程中起到重要的作用。
其他文献
本文通过对荣华二采区10
红细胞在流场中极易变形,随着血液的流动被拉伸成椭圆形,长轴随流动方向取向,变形的大小和取向的一致性随切变率的增加而增加。红细胞变形性是血液运输气体的必要条件,有重要的病
学位
本文以壳聚糖为载体,月桂酸为原料,引入疏水基团,制备一系列新型低密度脂蛋白吸附剂。考察了制备条件和吸附条件对脂蛋白吸附效果的影响,获得主要结论如下: 1)以环氧氯丙烷活化
本文分别以膳食纤维、壳聚糖为载体,十二胺为疏水配基,牛磺酸和3-氯-2-羟基丙磺酸钠为亲水配基,制备脂蛋白吸附剂。通过体外静态吸附考察其选择性吸附血浆总胆固醇(TC)、低密度
Disease Ontology(DO)的构建促使了疾病和疾病风险因子的研究,通过它,我们可以用语义相似性的测度来研究疾病间的相似性,同时,通过基因关联的相似疾病来理解基因之间的相似性,又可以
针对当今在科研和临床实践领域中对多模医学图像融合的迫切需求,该课题对全自动多模医学图像融合进行了应用性研究.由于配准和融合是多模医学图像融合的关键技术.作者分别改
邓小平关于社会主义和党的建设的论述,是邓小平理论极为重要的组成部分。当前,全党和全国人民正在深入贯彻党的十六大和十六届五中、六中全会精神,为建设社会主义新农村,建设
磁源性影像(Magnetic Source Image,MSI)是近几十年发展起来的将脑磁图(Magnetoencephalography,MEG)和磁共振(Magnetic Resonance Imaging,MRI)结合并广泛应用于认知神经科
CD4细胞是一种重要的免疫细胞,其在血液中的含量是表示人体免疫能力的重要指标。测定CD4细胞的含量(CD4计数)具有重要的临床意义。标准的检测方法采用流式细胞术(FlowCytometr