蛋白质序列的数学描述及其应用

来源 :浙江理工大学 | 被引量 : 0次 | 上传用户:neithernor86
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是由20个氨基酸残基组成的大分子,一个蛋白质序列可以看作是在20个氨基酸的字母表Ω上的字符串,即Ω={A,C,D,E,F,G,H,I,K,L,M,N,P,Q,R,S,T,V,W,Y}。因为蛋白质序列中氨基酸排列顺序在蛋白质折叠为空间结构时起重要作用,进而最终决定它的功能,所以对蛋白质序列进行深层次的分析是一个重要且有意义的工作。近几年,一些研究者将DNA序列的图形表示扩充到蛋白质序列的分析中,提出了蛋白质序列图形表示。然而DNA序列仅有4个碱基组成,要把DNA序列的图形表示应用到蛋白质序列上,需要考虑20个氨基酸按照什么样的顺序进行排列。目前主要有两种蛋白质序列的图形表示,一种是忽略同类氨基酸中的个体差异,将原来20种氨基酸分为4类或5类,这样就把蛋白质序列简化成一个4个或5个字符序列,从而减少可能的排列数。另外一种是忽略所有氨基酸之间的异同,直接根据氨基酸的字典序进行排列。我们首次提出氨基酸的循环排序概念,即把氨基酸按照某种规律排列成一个首尾相连的环。在本文中基于氨基酸的理化性质分类、PAM250替换矩阵、6阶反射Gray编码等,我们给出了几种不同的氨基酸循环排序。利用Chaos Game Representation(CGR)方法和不同的循环排序,我们得到了蛋白质序列的几种图形表示。接着,利用矩阵不变量、一阶类中心矩、图形比对等数学工具,对所得到的蛋白质序列的图形表示进行了数值刻画和数学描述,通过9个物种的线粒体NADH脱氢酶(ND5)序列的相似性比较,说明了我们的方法的有效性和可行性。最后利用得到的方法,我们分析了34种冠状病毒spike蛋白和45种流感病毒RNA聚合酶PB1的相似性,并由此推断这些物种的进化关系与分类。此外,利用得到的图形表示,我们还得到一个判断两序列匹配片断的方法。
其他文献
<正> 一、前言随着移动通信事业和支付技术的迅速发展,金融支付系统正在从有线走向无线。针对有线支付的不足,在 IC 卡技术及 POS 支付技术领域居世界领先地位的法国首先推出
本文通过对未成年人保护法十几年来实施状况的分析,论述了我国未成年人保护法修订与完善的必要性及应注意的问题,提出了修订与完善的立法建议。
<正>现代社会随着信息的发展,统计知识在我们的身边随处可见。为了能够帮助学生更好地了解生活中的信息,应该从小注重发展学生的数据分析观念,有效提高数据分析的能力。数据
目的对心肌梗死患者实施综合性护理的满意度、舒适度的影响效果进行研究、判定。方法选取本院收治的20例心肌梗死患者作为本次的研究对象,2015年2月至2016年1月期间,将其依据
<正> 阳光教育是一种正在生成中的新的内涵丰富、现实针对性强、便于操作的教育理念;是使自己阳光,给别人阳光,让大家共同阳光的教育;是面向全体,面向全面,面向全程的教育。
<正>绩效考核是指通过一定的方法和客观的标准,对职工的思想品德、工作能力、工作成绩、工作态度以及性格特点等进行的综合评价,是人力资源管理工作的重要内容及基础性工作。
抗日战争时期 ,根据地的民主实践是中共迅速发展和壮大的重要原因。从历史学和政治学的角度看 ,在制度层面规定一些民主权利是比较容易的 ,而抗战期间的中国共产党 ,除在制度
建立用气相色谱法测定苹果与土壤中代森铵及其代谢物乙撑硫脲的残留分析方法。当添加质量分数为0.05~0.5mg/kg时,代森铵在苹果及土壤中的回收率分别为90.3%~93.2%,83.0%~83.5%;
目的评价125Ⅰ放射性粒子植入联合GP方案治疗老年非小细胞肺癌(NSCLC)的可行性、安全性及疗效。方法40例老年NSCLC中,初治24例,复治16例,均行CT引导下瘤体内125Ⅰ粒子植入后3