论文部分内容阅读
阿兹海默病(Alzheimer’s disease, AD),又称老年痴呆症,是一种常见的神经退行性疾病,可以严重的影响病人的记忆和认知能力。目前,AD还不能有效治愈,主要的治疗药物都是基于“胆碱能假说”,即认为乙酰胆碱作为神经递质,其合成量的下降导致了认知能力降低。因此,乙酰胆碱酯酶(Acetylcholinesterase, AChE)作为一种催化神经递质中的乙酰胆碱的水解的丝氨酸蛋白酶,一直被看作治疗AD的有效靶标。而乙酰胆碱酯酶的抑制剂是最早上市的抗AD类药物。本论文利用计算化学及构效关系等方法建立了乙酰胆碱酯酶的抑制剂与非抑制剂的分类模型,以及抑制剂生物活性的定量预测模型。在第一部分,利用支持向量机算法建立了一系列乙酰胆碱酯酶抑制剂和非抑制剂的分类模型。收集了721个乙酰胆碱酯酶抑制剂和3892个非抑制剂,经过数据的预处理最后得到714个乙酰胆碱酯酶抑制剂和1983个非抑制剂。分别利用ADRIANA.Code和MOE软件计算得到分子结构与性质描述符211和334个,将它们分别单独使用,并最后混合用于模型的建立。利用相关性分析和逐步线性回归,F-score,Weka软件分别完成描述符筛选并利用支持向量机(SVM)建立了9个分类模型,通过5重,10重,leave-one-out交互检验,以及Y-scrambling进行模型检验,最好的模型分类正确率达到99.66%,最后又新收集86个分子作为外部测试集,分类正确率也达到了96.51%,对描述符的分析结合分子对接模拟(Docking)证实,氢键和疏水相互作用在配体结合中起着重要作用。在第二部分,针对404个乙酰胆碱酯酶抑制剂的生物活性进行了定量预测研究。一共计算了ADRIANA.Code中的19个全局描述符,8个形状描述符和1024个RDF描述符。通过随机和自组织神经网络分别划分训练集和测试集,通过相关性分析和逐步线性回归方法筛选得到16个描述符,利用支持向量机(SVM)和多元线性回归(MLR)分别建立了4个定量构效关系预测模型,所有的模型相关系数均达到了0.9以上,Y-randomization检验也证明模型不存在随机相关性。对描述符的分析结合分子对接模拟(Docking)证明了我们的描述符选择的合理性。本论文希望通过建立乙酰胆碱酯酶抑制剂的分类和预测模型对抑制剂的虚拟筛选和构效关系研究提供指导和帮助。