论文部分内容阅读
阿尔兹海默病(Alzheimer’s disease,AD)和 II型糖尿病(Type 2 diabetes,T2D)存在很大的关联性。T2D是AD诱导因子之一,对T2D不合理的治疗容易引发AD。目前同时患有两种疾病的人比例很高。并且T2D和AD有很多相似的病理特征:T2D和AD病人都有不同程度淀粉样沉积现象,都表现出不同程度的海马体损伤、认知功能性障碍,并且都与胰岛素和胰岛素抵抗有关。希望通过研究发现T2D和AD相关联的分子机制,找出相应的靶点,对研发同时治疗两种疾病的药物提供理论指导。AD和T2D都是复杂疾病,受多基因和环境的共同影响。全基因组关联分析(GWAS)是研究复杂疾病的强有力工具。目前学者们针对AD和T2D进行了多项GWAS。并发现了许多与疾病关联的变异位点。验证并发现了许多疾病相关的易感基因。APOE是之前确定的与AD有关的基因,并且在几乎所有AD有关的GWAS研究中得到了验证。此外还发现了大量与AD有关的易感基因:CR1、BIN1、CLU、PICALM、MS4A4/MS4A6E、CD2AP、CD33、PHA1 和 BCA7。解释这些基因的变异对疾病的影响是相对容易的。然而很多变异位点,位于非编码区,在内含子中或位于基因间。解释这些变异位点对疾病的影响是相对困难的。此外,由于连锁不平衡(Linkage Disequilibrium,LD),很难确定这些变异位点,哪些是真正的致病因子。ENCODE项目对DNA功能元件进行了注释。根据组蛋白修饰的多样性在9个细胞系中绘制了染色质状态图谱,包括增强子、启动子、沉默子和异染色质等。完成了 125种人类细胞和组织的DNase Ⅰ高敏感位点(DNaseI hypersensitive sites,DHSs)的全基因组图谱。利用这些信息,我们对GWAS获取的与疾病关联的变异位点进行了分析。DNA功能元件在不同的组织和细胞类型中呈现出不同的状态或功能。我们在研究AD时,选择神经胶质细胞,包括HA-c、HA-sp、Hah、NHA。在研究T2D时选择,选择胰岛细胞PanIsletD和PanIslets。通过研究分析,我们获得几个重要的发现:(一)本文选取了 27项与AD有关的GWAS,共101个与AD高度关联的SNPs,利用千人基因组项目的LD信息,设定r2为0.8,共获取1661个SNPs。分析发现共有34个SNPs位于DHSs。(二)随后根据细胞类型HA-c、HA-sp、Hah、NHA获取了 64168个DHSs详细信息。研究发现 rs47451883、rs105295609、rs99161161 分别位于 chr6:4745188047452030、chr7:105295520-105295670、chr13:99161100-99161250。它们影响的基因分别为 RP11-812I20.2、EFCAB10、FARP1、RP11-111L24.3、AL356423.1。(三)本文选取29项关于T2D的GWAS,共180个SNPs,根据千人基因组中LD的信息,设定参数产为0.8,共获取4167个SNPs,分析发现共69个SNPs 位于 DHSs。(四)通过对AD和T2D有关的变异位点,进行对比分析。发现许多变异位点,比如 rs12721046、rs12721051、rs56131196、rs4420638、rsll 1789331 和 rs66626994不仅与AD高度关联,也与T2D有很大的关联性。此外GWAS、千人基因组计划、ENCODE计划等重大基因组项目产生了海量的数据,而这些数据的分析目前仍是一项挑战,本文第四章对数据处理方法进行了研究分析。