论文部分内容阅读
噬菌体展示是一种高效获得具有特定亲和力的多肽或蛋白质的现代分子生物学技术。在基础研究中,可用于预测蛋白质相互作用位点与网络;在应用研究中,已广泛用于疾病的诊断、预防与治疗产品开发。然而,由于淘选体系与文库内在的原因,噬菌体展示实验数据中往往混杂着选择或增殖相关的靶位无关多肽(Target-Unrelated Peptides, TUP),且仅靠实验本身的改进并不能彻底消除这些噪声。因此,借助信息学手段来报告噪声序列,进而对噬菌体展示数据进行计算纯化等一系列预处理,不失为上佳之选。针对噬菌体展示实验数据的预处理问题,我们进行了如下工作:1、开发了基于模体的靶位无关多肽检测工具TUPScan。通过对已知靶位无关多肽模体进行匹配,TUPScan能够判断提交序列是否为潜在的靶位无关多肽。初步测试表明,TUPScan不仅能够提高表位预测工具的性能,而且有助于模拟肽疫苗的研究。2、开发了基于数据库的靶位无关多肽检测工具——MimoSearch和MimoBlast。为检测不具备已知模体的靶位无关多肽,我们又构建了一个模拟肽数据库MimoDB,收集了全球各研究组利用噬菌体展示淘选随机文库的实验结果。通过MimoSearch搜索此数据库,可以查看实验者提交的多肽序列是否与其它已发表的结果完全相同;通过MimoBlast工具可对MimoDB进行全数据库序列比对,可以找到与提交序列不完全相同但高度相似的已发表结果。如果多个研究组在淘选实验中使用的靶位不同却得到了完全相同或高度相似的序列,那么相应多肽极可能是靶位无关多肽。3、开发了基于支持向量机的靶位无关多肽预测工具——PhD7Faster和AvidinBinder。随着噬菌体展示领域内数据的不断积累,我们运用支持向量机算法,开发出两个靶位无关多肽的预测工具。PhD7Faster能够预测Ph.D.-7文库中具有增殖优势的克隆,这有助于报告淘选此文库所获得实验数据中的增殖相关的靶位无关多肽;AvidinBinder能够预测亲和素结合多肽,这有助于报告亲和素结合相关的靶位无关多肽。4、构建了一个在线的噬菌体展示实验数据预处理工具包SAROTUP。为便于读者使用,我们将上述研究成果开发成一个界面友好的集成网络平台SAROTUP,用户只需提交实验结果的序列信息,便可直接得到靶位无关多肽的报告结果。综上,本文提出了一系列报告靶位无关多肽的新方法,并且开发出一个噬菌体展示实验数据的预处理工具包SAROTUP(http://immunet.cn/sarotup/)。本课题的成果可能获得具有普遍意义的科学发现,相关网络程序及数据库必将成为全世界噬菌体展示相关科研工作的重要工具与数据资源。