论文部分内容阅读
蛋白质是由氨基酸按照一定顺序结合而成的一条多肽链,然后再由一条或多条的多肽链按照一定方式结合而成的高分子化合物.虽然蛋白质是无数氨基酸组成的多肽链,但每一种蛋白质都有自己特有的空间结构或称三维结构,这种三维结构通常被称为蛋白质的构象.蛋白质的结构决定了蛋白质的功能,即蛋白质的特定结构是蛋白质具有某种特定生物作用的根本原因,蛋白质不同空间结构决定了蛋白质生理功能的多样性.随着生物信息学的发展,通过机器学习方法预测蛋白质的三维结构成为可能,并能够达到相当高的准确率.蛋白质的两面角φ/ψ(C-N-Cα-C)能够在某种意义上表示质的骨架信息,而将蛋白的φ角对Ψ角投影即可得到Ramachandran[1]图,它包含了整个多肽链的构象空间,阐述了蛋白质骨架构象结构.Ison等[2]将φ/ψ角聚类到八个独立的区域,并且给这八种区域分别分配了八个字符来表示:S、R、U、V、K、A、T、G.由这八个符号构成的序列,称之为蛋白质骨架字符(ShapeString),由此形成了蛋白质三维结构向一维序列的转换.