论文部分内容阅读
后基因组时代最主要的研究任务之一就是阐明蛋白质的功能。蛋白质功能可以帮助人们理解复杂的生命现象。但是在许多情况下,不仅要了解蛋白质所发挥的作用,更需要理解为什么蛋白质会具有这种功能,这要求人们深入地研究蛋白质结构。然而,受到蛋白质结构和功能获取实验技术的限制,大量已知蛋白质的结构和功能仍是未知的。生物信息学的快速发展为解决这一问题提供了非常有效的途径。基于此,本文通过对特征进行发现和挖掘,研究了蛋白质结构和功能的预测及分析领域中几个相关问题。主要工作如下:(1)研制了一个二级结构预测工具。通过分析蛋白质二级结构端点位置附近氨基酸分布特征,发现这些位置上的氨基酸分布具明显的特异性。在此基础上,结合其它特征,构建了对二级结构整个片段进行整体预测的工具E-SSpred。利用标准测试数据集进行的测试结果表明,E-SSpred二级结构预测精度要优于同类软件,特别是对二级结构端点的预测准确度有大幅度的提高。(2)提出了一种考虑模板疏水环境的能量计算函数,并在此基础上开发了折叠识别预测系统。通过分析蛋白质结构中疏水环境对残基间成对相互作用能的影响,发现在不同疏水环境中残基相互作用能存在的差异。基于此,改进了折叠识别方法中的能量计算函数,并进一步将其能量函数应用于折叠识别方法之中。测试的结果表明,考虑疏水环境的影响可有效提高折叠识别的精度。(3)研制了基于二级结构元件的结构比对方法。通过分析二级结构元件特性及残基比对算法,针对于目前基于二级结构的结构比对方法在发现相关残基方面的不足,本研究在计算二级结构元件相似度时考虑元件的长度,并改进了残基对齐算法,基于此开发出了蛋白质结构比对工具3D-Sali。与同类软件的对比测试结果表明,3D-Sali具有较好的同源蛋白辨识能力,同时也可以很好的发现比对蛋白质间对应的残基。(4)分析了决定氨基酸替换对蛋白质功能影响的特征,并应用发现的特征进行预测。通过分析发现,功能位点及其相关位点上发生替换影响功能的可能性要远高于其它位点,而当前人们广泛应用的如进化信息等则不能反映这个现象。针对于此,功能注释数据库及位点相关性分析被用于得出功能位点及其相关位点信息,在此基础上进一步开发出氨基酸突变影响功能的预测方法。比较对比测试结果表明,这种方法可有效提高预测的精度。