论文部分内容阅读
MHC分子在免疫学中扮演着重要角色,该分子与多肽的结合反应是引起T细胞免疫的重要前提,所以MHC分子与多肽绑定预测问题成为了生物信息学中的研究热点。这方面的研究不仅有效的帮助理解免疫过程,也对计算机辅助疫苗设计有着重要作用。本文研究主要有以下三个目的:一.利用集成学习的方法对现有较好的三到四个方法进行集成,以达到更好的预测效果;二.当前主要方法是利用多肽的序列信息,很少利用MHC分子的结构信息,希望整合两方面信息进行预测;三.MHC分子具有高度多样性,不同MHC分子之间既有区别,又有联系,预测那些已知多肽绑定信息很少的MHC分子是一个重要而有意义的挑战。 针对上述三方面的思考,本文设计实现了TEPITOPEpan模型以及集成分类器。TEPITOPEpan方法是一个整合了结构信息的跨等位基因预测方法,成功的将可预测的等位基因数目扩展到上千个,使得所有已知序列的MHC分子均可通过计算得到特有打分矩阵用于绑定预测。集成分类器成功将现有的表现较好的三个分类器方法进行了集成,从而在实际预测中得到更好的预测效果。