论文部分内容阅读
进化是指种群里的遗传性状在世代之间的变化。共进化是生物体或生物分子中成对出现的对应改变。蛋白质共进化是指为了维持蛋白质功能性或结构稳定,对应于残基突变出现的补偿突变。研究蛋白质共进化可以窥探功能蛋白质的作用过程,进而发现重要功能结构位点。在本博士论文中,我们改进了共进化互信息模型,并且提出新的共进化互信息模型。首先改进共进化互信息模型,使得模型更加符合自然规律;其次对氨基酸.物理化学性质分类进行共进化度量;第三利用n维互信息将双残基共进化互信息模型扩展到多残基共进化互信息模型;最后通过度量基于邻近残基共进化关系的子序列对相关度,发现新的共进化性质。具体安排如下:1、在第二章中,提出整合氨基酸背景频率的共进化互信息模型(MIB)。为了消除进化压力对氨基酸出现频率的影响,利用氨基酸背景频率修正互信息中的边缘频率分布,使得统计频率符合自然界规律,进而预测功能位点。2、在第三章中,提出氨基酸物理化学性质的共进化互信息模型(MIP)。为了去除氨基酸背景频率对共进化度量的影响,我们结合了MIB模型到MIP模型中,提出去除氨基酸背景频率的残基物理化学性质的互信息模型(MIBP)。蛋白质功能结构的实现一定程度基于氨基酸残基的物理化学性质。将20种氨基酸按照物理化学性质进行十分类,利用互信息模型度量双残基的氨基酸物理化学性质的共进化程度,从新的角度对双残基共进化进行描述。3、在第四章中,提出预测多残基共进化的n维互信息模型(nDMI)。实验证明多残基参与蛋白质共进化过程,利用互信息矩阵及其特征值度量多残基共进化程度,结果表明nDMI模型可以识别多残基共进化,并且在已知存在多残基共进化的G蛋白和GPCR蛋白中,与双残基共进化互信息模型相比nDMI更加有效。4、在第五章中,提出度量基于邻近残基共进化关系的子序列对相关程度。参与共进化过程的多残基分布在几个子序列中,通过对两个子序列邻近残基共进化关系的相关性度量,窥探蛋白质序列内子序列的相关程度,进而得到一些双残基共进化中被忽略的功能结构位点。