氨基酸及蛋白质二级结构的统计分析

来源 :中国科学院理论物理研究所 | 被引量 : 0次 | 上传用户:zjwx2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生命活动的一种基本物质.对氨基酸性质及蛋白质二级结构的研究是生物信息学中的基本问题.蛋白质是由十十种氨基酸构成的.实验表明,不同氨基酸之间存在程度不同的相似性.这为氨基酸字母集的约化提供了依据.另一方面,在进行序列分析时,我们希望从蛋白质的残基序列中提取信息,从而对蛋白质的结构和属性进行研究.但与DNA序列相比,蛋白质序列更短,并且字母集又是DNA序列的五倍.对氨基酸字母集进行适当的约化可以增加统计中的信噪比,提高分析能力.文中,我们根据条件概率与随机背景的对数似然比对氨基酸字母集进行了约化,并将我们的结果与其它约化方法的结果进行了比较.另外,氨基酸相似性是蛋白质序列联配、蛋白质设计和蛋白质结构预测的基础.目前常用的计分矩阵都是基于蛋白质库整体而没有区分残基所处的蛋白质二级结构.了解蛋白质二级结构对氨基酸间相似性的影响可以提高我们对序列分析的能力.为此,我们利用Kullback-Leibler距离计算了不同蛋白质二级结构中氨基酸间的差异性,并据此对不同蛋白质二级结构中的氨基酸字母集进行了约化.虽然蛋白质二级结构的预测方法已经发展了三十多年,单序列预测精度仍然只在65%左右.为将预测精度提高到一个新的水平,人们进行了很多探索.文中,我们通过考虑残基间的三阶关联将GOR方法进行了扩展.我们根据描述处于特定二级结构态的中心氨基酸对两侧各位置处残基出现概率的权重矩阵得到了中心氨基酸对处于该二级结构态的计分体系.应用该计分体系,我们建立了一种蛋白质二级结构预测方法.作为一种只使用了单一序列的预测方法,它达到了70%的高精度.
其他文献
在这篇论文中,我们首先回顾了零温下手征σ模型在真空中的重整化过程,根据手征对称性,通过对传播子的重整化定出了全部的重整化常数.然后回顾了将重整化的手征σ模型应用到有
该文阐述了激光差分干涉测量稠密等离子技术的研究背景和意义,综述了国内外等离子体密度测量技术的研究现状.该文以建立完善的激光差分干涉测量稠密等离子体密度技术为目的,
这些年,我一直从事小学中高年级语文教学,感觉难度最大的还是"习作"的教学。虽然不可能人人成为能说会道的大作家,但还是要学会"用书面语言来表达自己的意思",以适应生活和社会的
碳纳米管是新发现的碳元素的另一种单质形态。它具有纳米数量级直径和微米数量级长度的圆柱面的外形。碳纳米管可以看作是由正六边形格子的石墨结构卷曲而成,具有很高的旋转对
量子纠缠态所体现的量子非局域性在量子信息学中扮演着特别重要的角色。作为量子信息学的一个重要分支,量子通信主要包括量子超密编码、量子隐形传态和量子密钥分发等。其中量
气体检测在环境保护和工业应用方面都有重要价值.红外光谱技术探测气体与传统的其他方法相比具有明显的优点.该论文是关于使用二氧化碳激光器测量氨气的实验.论文第一部分的
软物质及其复杂行为是当前凝聚态物理学科的前沿研究课题,是物理、化学、生物三大学科交叉产生的新的生长点.我们将粒子运动和分布所在的空间称为外部环境(简称环境),当环境
该文的工作主要围绕HT-7超导托卡马克上的激光汤姆逊散射诊断及其电子测试的测量而展开.HT-7超导托卡马克上的激光汤姆逊散射测量从1999年开始运行,采用的是钕玻璃激光二倍频
《水之韵》这一课,是我尝试开发的一种“语言变奏曲”的微课程,它是对语言文字的一次重新排列组合,因为新鲜,因为独特,因为陌生化,产生了“1+1>2”的教学效益。这一节《水之
期刊
间接驱动惯性约束聚变(Inertial Confinement Fusion: ICF)物理中,激光入射腔(靶)产生等离子体并与之相互作用是能量耦合的第一个环节,它将直接决定能有多少入射能量转换为有效的