基于深度学习的跨物种蛋白质巴豆酰化修饰位点预测研究

来源 :青岛大学 | 被引量 : 0次 | 上传用户:jiaofangjunonline
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质翻译后修饰(Protein post-translational modification,PTM)是指在酶和非酶条件下蛋白质的氨基酸侧链上共价结合化学小分子基团,它实现了蛋白质功能的指数级扩增。其中,赖氨酸巴豆酰化(Lysine crotonylation,Kcr)是最初在组蛋白上鉴定出来的一种修饰,它涉及多种生物学过程,与急性肾损伤、潜伏期HIV再激活、抑郁症等疾病相关。因此,从蛋白质序列数据中准确鉴定出巴豆酰化修饰位点,对基础研究和药物开发有着重要意义。识别巴豆酰化修饰位点的实验方法周期长、代价高,因此有必要开发计算预测方法。一些基于组蛋白的,最多包含169个巴豆酰化修饰位点数据的模型已经被开发出来。最近,已通过实验在人类、木瓜、大米和烟草的非组蛋白上各验证了数千个巴豆酰化修饰位点。而对于以前基于组蛋白开发的巴豆酰化修饰分类器是否能识别非组蛋白巴豆酰化修饰位点尚不清楚。所以,急需设计一种跨物种的可识别组蛋白和非组蛋白的蛋白质巴豆酰化修饰位点预测模型。针对目前蛋白质巴豆酰化修饰位点预测中存在的几个问题,进行的主要研究工作如下:(1)首次构建了非组蛋白巴豆酰化标准数据集。通过检索和收集生物实验数据,通过四步数据清洗过程构建了标准数据集。(2)巴豆酰化修饰的特征提取与特征选择。通过组合不同的特征和算法构造了12个不同的分类器来识别非组蛋白巴豆酰化位点。实验结果表明,增强组氨基酸组成(Enhanced Grouped Amino Acid Composition,EGAAC)相对于已发表文献中表述的最佳特征提取算法K-间隔氨基酸对(Composition of k-spaced Amino Acid Pairs,CKSAAP)和其他经典的氨基酸序列特征提取算法,更有效的提升了巴豆酰化修饰位点的预测性能。(3)第一个构建了基于深度学习的跨物种巴豆酰化位点预测模型,命名为DeepKcrot。通过模型间性能的讨论与可视化展示,讨论了数据量对深度学习模型预测性能的影响。探讨了已发表的基于组蛋白的模型和非组蛋白的模型间是否相互适用的问题,并在DeepKcrot添加组蛋白巴豆酰化数据重新训练后,使其对于组蛋白和非组蛋白巴豆酰化修饰位点预测均表现优秀。随后比较了基于不同物种构建的模型和基于所有物种数据训练的模型间的性能差异,基于物种差异性,在DeepKcrot中保留了一个跨物种通用模型和四个特定物种模型。(4)开发了DeepKcrot算法的高性能在线预测服务器(http://www.bioinfogo.org/deepkcrot/)。
其他文献
位姿估计是计算机视觉和摄像测量学中的基础性问题,常用于视觉伺服、SLAM等领域。针对舰载机刚体目标的位姿估计和跟踪问题,本文分别对使用几何测量和深度学习的方法进行探讨
作为智力密集型产品,软件开发过程中不可避免地会出现软件缺陷。为了定位、修复软件缺陷,维持系统正常运行,软件调试与维护活动几乎持续贯穿了软件的整个生命周期,但这付出了
体育运动作为一种伴随着人类历史发展的活动,对普通大众有着一种天然的吸引力。众多学者的研究表明,体育赛事的成功举办对当地的经济、文化、政治和社会影响等方面会产生积极
随着煤炭开采深度的增加和开采环境的恶化,每年都会发生各类煤炭开采安全事故。为了提高事故救援的效率和安全性,研究人员研制了救援机器人可进入巷道参与救援行动。由于矿井
钛酸铋钠(Na0.5Bi0.5TiO3,简称BNT)陶瓷是一类具有巨大发展前景的无铅压电陶瓷,但由于其矫顽场和电导率较高,致使陶瓷难极化,在实际生活中难于被应用。因此,对于BNT陶瓷存在
进入21世纪后,互联网技术飞速发展,数据可以快速通过线上方式进行获取和存储,这为数据挖掘工作带来了机遇,但由于各种原因往往会获取到不完备数据,如何准确、有效的处理不完
量子计算因其具有经典计算无可比拟的优势受到了广泛的关注,其发展对当今密码学的安全构成了威胁。众所周知,Shor算法可以在多项式时间内破解多种公钥密码方案,如RSA和ECC。
近年来,以雌激素为代表的新型污染物陆续在土壤、地表及地下水中被检出含量超过安全值,由于雌激素有很强的内分泌干扰性,因此对其的去除成为了亟待解决的问题。吸附法作为一
高硫石油焦在电解铝生产应用过程中,不仅腐蚀设备,污染大气环境,并且严重影响原铝品质。因此,有效降低高硫石油焦硫含量并且控制产生烟气中硫排放对炭素行业及电解铝行业的可
在油/水液滴界面上进行胶体颗粒的自组装是一种非常有效的自下而上的用于制备功能性微胶囊的方法。匹克林(Pickering)乳液是以固体颗粒代替传统的表面活性剂分子附着在胶囊的表