论文部分内容阅读
阿尔兹海默症(Alzheimer’s Disease,AD)是一种严重的进行性神经系统疾病,是最为常见的痴呆类型;它破坏患者的记忆及其他重要的认知功能,导致患者出现持续的智能减退和行为能力的异常,严重影响患者的日常生活和社会功能,同时带来沉重的家庭和社会经济负担。AD的病理机制十分复杂,往往由多种遗传因素、环境因素以及一些社会心理因素共同作用引起。迄今为止,还没有任何一种药物能够有效治疗AD。考虑到传统药物研发周期长、过程复杂及耗资巨大的缺点,本研究采用系统的计算药物重定位的方法来探索可用于AD的候选药物,同时基于现阶段基因组学、蛋白质组学以及生物信息学的研究成果,进一步了解AD的复杂的分子机制和内在联系。研究内容和方法:(1)收集AD风险基因。从OMIM(Online Mendelian Inheritance in Man)、KEGG(Kyoto Encyclopedia of Genes and Genomes)和Phe Gen I(the Phenotype-Genotype Integrator)三个数据库搜集已知的AD相关的基因。(2)功能富集分析。为了揭示AD复杂的分子机制,对AD的风险基因集进行功能富集分析,包括GO(Gene Ontology)生物进程术语和KEGG生物通路条目;同时,通过对AD风险基因网络进行功能模块分析,探寻AD的主导遗传因素。(3)构建人类蛋白质相互作用网络、收集药物小分子。分别从Hu RI(the Human Reference Protein Interactome)、PINA(Protein Interaction Network Analysis platform)和STRING(the Search Tool for the Retrieval of Interacting Genes/Proteins)三个数据库收集现有的人类蛋白质关联数据,构建完整的人类蛋白质相互作用网络;为了实现药物重定位算法,从Drug Bank数据库中提取详细的药物小分子数据。(4)计算药物与AD基因在PPIN中的距离。基于PPIN(Protein-Protein Interaction Network)计算药物与疾病的相关程度,从而发现疾病的潜在药物,是药物重定位的一种有效策略。研究中,我们提出了一种网络算法,基于收集的AD的风险基因集和PPIN,能够无偏的计算药物小分子与AD基因集在网络中的接近近程度,通过设定合适阈值,筛选AD潜在的治疗药物。(5)逆基因集富集分析算法(Inverse Gene Set Enrichment Analysis,IGSEA)筛选AD的候选药物。基于药物作用实质上是逆转病态的基因表达以回归正常的假设,我们提出了IGSEA算法,在网络算法的基础上进一步筛选可用于治疗AD的候选药物。(6)药物评估。通过查阅文献,了解药物适应症和前瞻性研究,评估以上算法得到的药物是否可成为候选药物。研究结果:(1)AD的风险基因集。从数据库中一共收集到561个AD的风险基因,包括APP、PSEN1、PSEN2和APOE等明星基因,还有与能量代谢相关的NDU家族和UQCR家族,与突触形成、递质传递等相关的CHRNA家族和HTR家族等。(2)功能富集分析。通过对AD风险基因的功能富集分析,揭示了这些基因涉及的生物进程和生物通路及其中联系。其中富集到的大类的GO生物进程18条,包括NADH脱氢酶(泛醌)活性、淀粉样β蛋白代谢过程和神经发生的调控等;大类的KEGG通路10条,如胆碱能突触、多巴胺能突触及众多的信号通路。(3)AD的候选重定位药物。通过从数据中搜集人类的蛋白质相互作用信息,构建了包含17232个蛋白/基因,493232个作用关系的完整的网络;从Drug Bank中提取了5595个含有靶标信息的药物。通过基于PPIN的网络算法,筛选到了1092个与AD距离较近,关系密切的药物;再通过IGSEA算法筛选,最终有24个药物得以保留,作为本研究重定位用于治疗AD的候选药物。(4)药物评估。通过查阅文献和数据库,24个药物适应症包括精神类疾病、心血管疾病、炎症和癌症等疾病和症状;其中沙利罗登(Xaliproden)是正在被研究用于AD的药物。结论:通过生物信息学方法对AD的相关风险基因集的分析,揭示了AD复杂的病理机制,除了先验的淀粉样蛋白代谢调控过程,还发现能量代谢过程、信号转导通路,特别是神经系统的发生过程对AD的进程与重要影响。总之,AD的发生和发展涉及全身各大系统,众多生物过程的联合作用。另外,通过计算药物重定位的方法,本课题筛选到了数十个可能的治疗AD的候选药物,其适应症广泛。当然,这些药物的药用价值、用法用量等须进一步的实验证明。此外,研究中使用的算法在针对类似AD的复杂疾病的候选药物筛选是十分有效的,为计算药物重定位方向提供一个新的思路。