基于深度迁移学习的赖氨酸乙酰化位点预测问题的研究

来源 :东北师范大学 | 被引量 : 3次 | 上传用户:sony360
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质翻译后修饰是计算生物领域最重要的问题之一,通过将碳、氧、氮原子上引入乙酰基CH3CO-,以及功能基团添加到一个及以上的氨基酸上改变蛋白质的性质的反应被称为乙酰化。乙酰化一直以来,是最重要的翻译后修饰之一,在许多生物机制中发挥重要作用,例如转录调节机制,细胞凋亡以及细胞的因子信号传导。研究某个氨基酸残基是否会发生乙酰化反应,以及对乙酰化机制的探索和学习对理解细胞的遗传信息表达、生物机理的调控有重要意义。用于鉴定蛋白质乙酰化位点的现有方法可以分为两大类:质谱法和计算方法。基于质谱的实验方法可以发现来自真核生物的乙酰化位点,但是可能耗时且昂贵。因此,有必要开发能够有效且准确地鉴定蛋白质乙酰化位点的计算方法。现有的计算方法通常依赖特征工程,数据收集、特征提取的好坏严重影响乙酰化位点判断的准确,多余的特征和不相关的特征将分别导致冗余和判断失误。基于这些问题,本文使用深度学习框架帮助乙酰化位点预测,它能够通过多层网络和非线性映射操作从大规模训练数据集挖掘潜在特征。在这项研究中,本文提出了双模型深度学习架构帮助乙酰化位点的预测。首先从蛋白质赖氨酸修饰数据库(PLMD)中收集数据,包括泛物种乙酰化数据以及三个物种的乙酰化数据,并划分为训练集、验证集和独立测试集。再从数据中提取两类特征,一是蛋白质序列信息,二是理化属性。针对两类特征,先训练了两个不同的网络,再将两个网络融合增加预测位点的准确性,并使用贝叶斯方法进行调参优化。为了预测数据集规模较小的物种特异性数据,利用迁移学习,将网络迁移到特定物种数据集上进行乙酰化位点预测,也取得了好的效果。实验结果显示了本文网络的有效性,准确率为70.8%,敏感性为72.3%,特异性为70.7%,MCC值为0.251。在物种特异性数据上也取得了比其他工具好的表现,说明本网络可以适用于乙酰化位点预测。
其他文献
合理运用机泵节能技术提高机泵的设计或运行效率是机泵节能的关键所在。本文从理论上阐述了切削叶轮外径和变速调节的原理和应用依据,介绍了以上两种机泵节能技术在延迟焦化
运用Flash软件开发全交互智能化模拟实验课件,将为学生提供直观而形象的认知,帮助他们实现规律的建构。本文从物理教学中进行模拟实验的可行性研究开始,结合实例对Flash全交
文章利用VAR-DCC-MVGARCH模型对人民币汇率与东盟七国汇率进行分析,通过动态相关性测度人民币在东盟区域的影响力。结果表明:总体来看,人民币对东盟七国货币影响力的排名从高
目的:考察高中生自我隐瞒及其与自我和谐的关系。方法:采用自我隐瞒量表、自我和谐量表对326名高中生进行测量,用描述性统计分析、相关分析、回归分析对数据进行分析。结果:
长期以来,我们的英语教学因受应试教育模式的影响,在授课方式上,过分强调教师的主导作用,忽视了学生的主体地位。这种教学模式导致了许多学生学习自主性弱、学习方法机械、呆板,主
纳尔逊.古德曼(N.Goodman)美国人,著名的哲学家和逻辑学家。其主要的代表作《反事实条件句困境》于1946年在《科学杂志》上公开发表,这篇文章主要体现了古德曼有关反事实的真假判
氯化聚丙烯是一种聚丙烯的化学改性物 ,它有许多优点 ,为了进一步提高其性能 ,通常需对氯化聚丙烯进行接枝改性。介绍了氯化聚丙烯的特点 ,较详细综述了氯化聚丙烯的接枝改性
代理授权行为作为委托代理权的发生原因,是代理制度中的关键问题。授权行为的独立性是事实判断问题,授权行为区别于基础关系,并不是基础关系的外部表现,其独立性是客观存在的
探讨地塞米松冲击疗法联合手术治疗肉芽肿性乳腺炎的疗效及安全性。选取2014年12月至2017年12月肉芽肿性乳腺炎患者200例,随机分为冲击组和常治组,每组100例,常治组给予地塞
现代先进轴流压气机级负荷不断提高的发展趋势导致流动分离日益严重。借助数值模拟分别对非定常射流和定常射流进行了参数优化研究。结果表明:基于射流的主动流动控制能有效弱