基于深度学习架构的蛋白质远程残基接触预测研究

来源 :清华大学 | 被引量 : 1次 | 上传用户:qijisama
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
合适的残基与残基接触被认为在维持蛋白质的天然构象和指导蛋白质折叠方面发挥着关键作用。实际上,蛋白质残基接触预测能够为蛋白质结构预测提供非常有价值的信息,因为残基接触信息,特别是远程残基接触信息,能够被用来直接指导蛋白质三维结构的重构、通过改善能量函数的最小能量面以有效缩小构象搜索空间,和通过构建打分函数来进行模型评价和选择。此外,它的应用还被扩展到合理的药物设计。尽管近年来对蛋白质残基接触预测有了较为深入的研究,并且CASP国际竞赛也极大地推动了这一领域的发展,但预测准确性仍然较低,因此也得到了越来越多的关注。目前,蛋白质残基接触的预测主要分为基于模板的方法和基于序列的方法。前者基于同源模板来进行预测,因而限制了它的使用。相反,后者仅仅基于氨基酸序列来进行预测,因而更具有研究价值,也获得了更多的研究热情。基于序列的方法大体上主要包括基于机器学习的方法和基于共进化信息的方法,前者主要通过检索结构数据库中的统计信息来构建各种各样的机器学习模型,而后者主要使用蛋白质非冗余的同源序列的多重序列比对得到的共进化信息。已有研究表明,以上两种方法的结合能够有效提高残基接触预测的准确性。本研究中,我们提出了DeepConPred方法,包含两个基于深度学习的模型(DeepCCon和DeepRCon)和一个优化过程,通过有效结合结构数据库中的统计信息和序列数据库中的共进化信息来提高远程残基接触预测。DeepConPred使用一个层次架构,通过在第一阶段DeepCCon的预测结果来进一步促进DeepRCon的远程残基接触预测。对这两种方法,我们设计了一些新颖的特征,通过结合已有的有效特征对蛋白质结构性质进行更全面的描述。进而我们使用特征选择技术选取最具辨别能力的特征子集,使用深度学习技术构建模型,有效提高对蛋白质二级结构片段接触和远程残基接触的预测准确性。特别地,DeepCCon和DeepRCon通过使用有限的非冗余同源序列得到的共进化信息来进行模型训练,以确保对小家族蛋白具有鲁棒性。因此,随后的优化步骤被用来综合所有的非冗余同源序列得到的全面的共进化信息来提高大家族蛋白的预测准确性。广泛的实验表明DeepConPred能有效提高蛋白质远程残基接触预测的准确性,能被认为是一种极具竞争力的方法。
其他文献
长久以来,内部审计我国企业中的独立性和权威性一直饱受诟病。往往内部审计开展工作时处处受限,无论是在审计过程中遭受的各种阻力,还是从审计工作的效果来看,都体现了内部审
当前各种高科技技术的不断发展,大大促进了数字化测绘技术的应用和进步,而且数字化测绘技术在工程测量当中还发挥出了非常重要的作用和意义,属于现代化测量当中的一个主要措
电力系统构成复杂,涉及到的相关线路、设备等比较多,主要为人们提供电力资源供应等相关服务。变电设备是电力系统中的主要构成部分,决定了电力系统运行是否安全、可靠。在日
父亲接触股市是因为我,那时股市是牛市,随便买哪只股票都能赚。从家里拿了三万元,没过多久我就赚到钱了。可是几次操作失误,就由赚到赔。那时,赶上单位提高学历要求,忙着考研
私募股权投资基金起源于美国,经过30多年的发展,迄今为止全球已有数千家私募股权投资基金公司。私募股权投资基金作为一种商业操作方式,是专家管理投资于企业股权的基金,目前
光电子技术作为新一代高新技术,在光通信、激光、微光机电体化、清洁能源和绿色照明工程等众多方面都获得了高速发展。如今,光与其它科技及产业的结合将产生更广泛的边缘学科
一、我国内部审计独立性和权威性的现状我国内部审计经过十几年的努力,已经取得了很大成绩,在我国审计监督体系中,成为一支重要的生力军。通过内部审计,给各行业带来了可观的经济
在现代中国社会的转型时期,青年民间组织的发展为传统意义上的共青团工作开辟了新的工作平台。上海城市的快速发展和网络的迅速普及,推动了青年民间组织的勃兴。本文将共青团
汉字词作为世界上唯一沿用至今的文字,拥有几千年的历史。每一个汉字词的生成发展演变,都有其具体的社会历史背景和文化背景,所以,通过对汉字词的生成发展和演变进行梳理,可以挖掘
本文对国内图情专业开设的信息组织课程进行调查,从信息组织课程设置、高校研究生信息组织研究方向及信息组织知识体系的演进三方面对国内信息组织教育存在的问题进行分析,并