蛋白质的β-发夹、β(γ)-转角及四类简单超二级结构预测

来源 :内蒙古大学 | 被引量 : 1次 | 上传用户:yongz
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
由于蛋白质的功能与其结构是密切相关的,因此研究蛋白质的结构是获取功能信息的重要手段。随着人类基因组计划的顺利实施,蛋白质序列信息的积累速度远快于蛋白质结构数据的增长速度。然而,通过实验手段确定蛋白质的结构,不但成本高、耗时,而且实验中还会遇到一些目前无法解决的技术困难,因此人们非常希望能利用理论计算的方法直接从序列信息预测蛋白质结构,这也是生物信息学研究的重要课题。目前,直接从序列信息预测蛋白质的三级结构还很困难。由于局域结构有着较强的序列信号,且在三级结构中大量存在、频繁出现,对蛋白质的折叠、识别和稳定性起重要作用,因此,局域结构的预测可以简化结构预测问题,是蛋白质三级结构预测重要的中间步骤。本文主要研究蛋白质局域结构中超二级结构的预测,重点研究β-发夹模体的预测;研究了部分规则二级结构中β-转角和γ-转角的预测。1.提出了一种新的预测算法一基于离散增量的支持向量机算法,用该算法首次对超二级结构数据库(ArchDB40)中β-发夹模体进行了预测,取得较好效果。2.利用离散增量和序列打分值构成的向量来表示序列信息,将离散增量和打分值作为向量输入支持向量机,在向量空间中寻找最优超平面,提出了一种新的组合向量预测算法。该算法首次应用于β-发夹模体的预测,对ArchDB40超二级结构数据库中β-发夹数据集和文献(Kumar and Bhasin,Nucleic Acids Research,2005,33:154-159)中已有的β-发夹数据集的预测结果显示,我们的算法可以实现比以往方法更高的预测成功率。与文献中已有数据集的预测结果相比,对独立的检验集预测精度提高4%,β-发夹的敏感性提高6%。另外,将这种算法首次用于ArchDB40数据库中的四类简单超二级结构分类,无论是对5-交叉检验的训练集,还是对独立的检验集都取得较好分类结果。3.在离散增量和序列打分值的基础上,进一步把预测的二级结构信息加入组合向量,将它们共同输入支持向量机,对普遍使用的,分别包含426个和320个蛋白质序列的两数据集中的部分规则二级结构β-转角和γ-转角进行了预测。结果指出,对β-转角的7-交叉检验预测精度达到79.8%、相关系数为0.47:对γ-转角5-交叉检验预测的相关系数达到了0.18,这些结果都是目前最好的预测结果。4.建立了一个新的包括2208个非冗余蛋白质链的数据库,蛋白质结构分辨率高于2.5(?),序列相似性小于40%。得到α-α模体6799个,α-β模体6711个,β-α模体6072个和β-β模体8163个,首次将最小离散增量算法用于蛋白质四类简单超二级结构预测,当序列模式固定长取8个氨基酸残基,对“822型”序列模式3-交叉检验的平均预测精度达到78%,Jack-knife检验的平均预测精度达到76.8%;当序列模式固定长取10个氨基酸残基,对“1041型”序列模式3-交叉检验的平均预测精度达到83%,Jack-knife检验的平均预测精度达到79.8%。5.在蛋白质简单超二级结构分类预测、β-发夹预测、β-转角预测及γ-转角的预测工作中,引入了二肽组分信息参数和亲疏水特征信息参数,改善了预测结果。
其他文献
清中叶以后,近代新闻出版业的出现促使印刷技术推陈出新,反过来,印刷技术的革命又使得新式报纸如雨后春笋般蓬勃发展,两者相辅相成,相互激荡。伴随着新式报纸的勃兴,不仅印刷
全国年轻的女教师同行们,我也是一个年轻女教师,今年35岁。我的学校不在城市,在乡村。学校是单人校,分幼儿、一、二、三、四个年级,教师却只有我一个人,又是科任老师,又是班
“新时代是奋斗者的时代”。幸福不会自己来敲门,要靠奋斗去创造。幸福来自奋斗,奋斗本身就是一种幸福。推动社会发展、时代发展、国家进步、民族进步的幸福,是最大的幸福、最令
报纸
建设生态文明、推动人与自然和谐发展的理念已在全国各个阶层中得到一致认同。国家级风景名胜区代表了国内生态最好、环境最美的区域,应当在生态文明创建中起到示范带头作用
在决定国民经济动员的资源储备量时,利用混合正态分布密度函数,对于一定范围的地域在一个国民经济动员周期内,为应对某种危态类型所需的相关国民经济动员资源量进行估测.方法
2010年10月,WTO专家组对中关“双反”争端作出第WT/DS379号裁决。该案的核心在于补贴的认定,其中主要涉及中国土地使用权的补贴专向性认定、上游产业利益传递分析以及对“非市场
本文总结了景观、雕塑长时间以来,在施工过程中用到的水泥材料,塑型技术。主要包括塑型工具、塑型步骤和塑型方法,期望对水泥雕塑的工作者有一些参考作用。
本文以我国为代表的发展中国家为例,重点分析新国际贸易保护主义对刚起步的高新技术产业的影响,以及在新形势下如何应对这些隐形的贸易保护主义,更好地适应经济全球化和市场
《普通高中英语课程标准(2017年版)》首次将"语篇类型"作为学生英语学科核心素养的六要素之一。语篇类型包括记叙文、议论文、说明文、应用文等不同类型的文体,记叙文语篇类