基于序列特征的蛋白质功能类型预测器研究

来源 :景德镇陶瓷大学 | 被引量 : 2次 | 上传用户:bhf10116
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是细胞和生物体生命活动的主要承担者是生物性状的体现者。近年来,随着生物科技的不断发展,蛋白质数据呈雪崩式增长,仅仅通过生物实验来满足人们对于蛋白质结构和功能研究已经不太现实了。为了缩短研究周期和节约宝贵的研究经费,生物信息学者开发出一系列基于计算的方法来预测蛋白质的众多属性。在蛋白质研究中存在许多专业分类方法,每一种分类准则在一定领域内都有很重要的实用价值。蛋白质分类问题作为蛋白质组学研究的一个分支,近年来受到越来越多研究者们的关注。蛋白质分类研究是全面掌握蛋白质结构与功能的前提和基础,在分子生物学、细胞生物学、药理学和医学中扮演着非常重要的角色。本文在前人研究基础上,针对当前蛋白质分类预测研究中的三个热点问题:酶催化位点预测、DNA绑定蛋白识别和抗冻蛋白质识别进行了研究。虽然蛋白质的结构信息对预测其功能有非常大的帮助,但由于现有生物技术的限制,人们还不知大多数蛋白质的结构信息,蛋白质一级结构顺序决定了其三级结构和功能,所以本研究采用了基于蛋白质序列信息的方法。我们在构建氨基酸数字模型的时候,在数据层融合了氨基酸的物理化学性质、氨基酸成分、特异性位置打分矩阵、灰色动态因子和二联体组成成分等信息,所建立的蛋白质序列离散模型不仅简单,而且包含丰富的物理化学和遗传进化信息。在训练集构建过程中严格选用生物实验所确定的数据,并去除了有冗余度的数据,使得训练集能很好的对设计的算法进行评估。基于智能算法优良的鲁棒性,我们采用模糊K近邻法和随机森林法,以及融合算法,建立了酶催化位点预测、DNA绑定蛋白识别和抗冻蛋白质识别预测器,这些预测器与现有方法相比,在准确度、灵敏度、特异性、Matthew相关系数和ROC指标上都有较大提高。我们还分别建立了在线预测器网站,并且详细说明了操作步骤,方便广大研究者及时使用,使得生物学者不用考虑算法中的复杂公式,只要在网站上输入相关格式的蛋白质序列,就可以得到预测值,提高了预测器的使用效果。本文所设计的预测算法同样能够应用于其它相关的蛋白质预测研究领域。
其他文献
随着线性理论的日臻完善,非线性科学的重要性逐渐在物理学、化学、信息科学和生命科学等领域中显现出来.非线性偏微分方程是描述各领域中出现的实际问题的数学物理模型,研究
本文通过运用高阶泊松核与高阶庞培算子,主要研究了上半复平面带有L~P边值的非齐次多调和狄利克雷问题,并且给出了在特定估计下唯一积分表示解。全文共分为三章:第一章,主要
图染色问题是一种典型的组合优化问题,现实生活中的很多问题如加工调度、任务分配、负载平衡等都可以用图染色的方法来解决。近些年来,随着计算机技术的发展和解决实际问题的
作为数据挖掘中一个正在蓬勃发展的研究领域,复杂网络分析正引起越来越多研究人员的关注。社区发现是复杂网络研究中一项十分重要的基础性工作,它可以为复杂网络的分析与研究
基于三维图像的场景重构和感知算法具有广泛的应用场景,能够为自动化系统提供关于工作空间的先验参考信息,相关算法和应用的研究希望建立一个能够自动对场景进行重构和分析以
本文以地方国有粮食收储企业为研究对象,在系统整理相关文献,结合企业特性的基础上,从财务效益、管理效益及社会效益三个维度设置体现高质量发展特征的评价指标。根据湖北省地方国有粮食收储企业2014-2018年度财务报表及问卷调查收集的相关数据,运用直觉模糊层次分析法对地方国有粮食收储企业的发展现状进行绩效评价。结果显示地方国有粮食收储企业绩效得分74.77分,处于第三等级[60,80)范围内,整体水平中
交换期权是发达国家金融市场中一种成熟的衍生产品,它的到期收益由标的资产在到期日的价格差决定。交换期权的标的资产可以是任何类型的金融产品,包括商品、股票、债券、货币
真菌毒素是指由真菌产生的次生代谢物,如赭曲霉毒素A、玉米赤霉烯酮、黄曲霉毒素、脱氧雪腐镰刀菌烯醇等。不同种类的真菌毒素毒性虽不同,但会污染农产品及其制品,危害人和动
托鲁巴姆(Solanum torvum L.)在农业生产上广泛应用于茄子砧木,其植株对青枯病,黄萎病,尖刀镰孢菌都有着较高抗病性。将茄子嫁接在托鲁巴姆砧木上可以有效的抵抗这些土传病害
学位