论文部分内容阅读
预测蛋白质的相互作用在理论和实践上都具有非常重要的意义。生物的遗传信息记录在DNA中。但是,一般而言DNA无法直接实现其生物功能,只有当DNA被翻译成蛋白质后,这些功能才能够实现。因此,蛋白质是实现生物功能最直接也是最重要的生物大分子。事实上每个生物功能都是由一组蛋白质的共同参与才能实现的。成百上千的蛋白质参与了生物体内代谢途径的调节、免疫识别以及DNA的复制等各种生命活动,特别是它们之间的相互作用,使得生物功能具有难以置信的多样性。
目前,有许多生物学实验方法和计算机试验方法可以用来进行蛋白质相互作用的研究,这些方法极大地深化了人们对蛋白质相互作用的认识。但是,生物学实验的方法过于费时费力,而现有的一些计算机试验方法则对于所研究的蛋白质序列又有较高的要求,所以研究和开发新的预测蛋白质相互作用的计算机算法就凸现了其重要性。
针对存在的问题,我们在文中介绍了共鸣识别模型,该模型利用离散傅立叶变换对蛋白质序列进行分析,并利用分析的结果预测蛋白质相互作用,从而大大降低了预测对序列的要求,它可以直接从蛋白质序列预测蛋白质相互作用;在应用共鸣识别进行蛋白质相互作用预测时,需要一定数量的同源序列,如果无法搜索到足够的同源序列,那么预测将无法进行。针对这个问题,本文又对该模型应用离散小波变换进行改进,从而进一步降低了预测过程对同源序列数量的要求。
为检验该算法对蛋白质相互作用预测的效果,文中采用了三个物种的蛋白质相互作用数据和一组不能相互作用的蛋白质分别作为训练集和测试集对该模型进行训练和测试。测试的结果显示,此算法可以达到较为理想的预测效果。为了使科研人员能更加方便地使用该预测算法,开发了MRRM-PPIP软件包。这是一个用C++语言开发的面向对象的程序,使用者可以根据自己的需要预测相应的蛋白质之间的相互作用,并且还可以根据需要扩充程序的功能。