基于深度学习的蛋白质翻译后修饰位点预测相关问题研究

来源 :青岛科技大学 | 被引量 : 0次 | 上传用户:myna5726
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质翻译后修饰(post-translational modification,PTM)是指在mRNA翻译后形成蛋白质过程中的一种化学修饰。PTM是增加生物多样性的关键机制,几乎影响正常细胞生物学和发病机制的方方面面,包括细胞分化,蛋白质降解,信号和调节等过程都发挥着重要作用。PTM的相关问题已成为当今蛋白质组学研究中的重要课题,对于PTM位点的全面及准确的识别是目前研究的热点与难点。为了更有效预测蛋白质翻译后修饰位点,有效提升预测精确度,本文基于深度学习,完成主要工作如下:1.提出了一种新的丙二酰化预测模型Malsite-Deep。首先,采用七种特征提取方法对蛋白质序列进行特征提取,得到原始特征空间。其次,运用欠采样Near Miss-2方法对数据进行不平衡处理并通过门控循环单元(Gated Recurrent Units,GRU)的更新门和重置门选择最优特征子集,去除冗余和不相关信息。最后,将GRU层得到的数据输入深度神经网络(Deepneural networks,DNN)中对丙二酰化位点进行预测,并利用十折交叉验证和独立测试集对模型性能进行评估。十折交叉验证表明,训练集中AUC值达到0.99。四个独立测试集中AUC值均达到0.95以上。实验结果表明Malsite-Deep有助于鉴定蛋白质丙二酰化位点。2.提出了一种新的羰基化预测模型PreCar_Deep。首先,采用六种特征提取方法对蛋白质序列进行特征提取,得到原始特征空间。其次,运用Group LASSO最优特征子集,去除冗余和不相关信息并通过过采样Borderline-SMOTE方法对数据进行不平衡处理。最后,将Borderline-SMOTE得到的数据输入本文构建的深度学习框架中对羰基化位点进行预测,并利用十折交叉验证和独立测试集对模型性能进行评估。结果表明PreCar_Deep有助于鉴定蛋白质羰基化位点并极大降低实验成本。3.提出了一种新的多种类型酰化位点预测模型PMPA_DeepTL。首先,通过九种特征提取方法包括AAC,ANBPB,DDE,EBGW,CT,MMI,Hydropathy index,AD和BLOSUM62将蛋白质序列转化为数字信息,并对这些数字信息进行特征融合。其次,对于本文数据正负样本严重不平衡问题利用过采样与欠采样相结合的方法SMOTETomek将数据处理为平衡数据。最后,利用卷积神经网络对琥珀酰化位点进行分类。通过琥珀酰化位点数据集预训练的模型,对卷积神经网络的全连接层进行微调参数,将模型迁移到不同酰化位点数据进行分类。相比于其它预测模型,琥珀酰化位点的数据集在独立测试集AUC值都达到了0.9以上,同时通过微调预训练模型的网络,其它不同类型酰化数据集也都达到了较好的精度,表明PMPA_DeepTL有助于鉴定蛋白质多种酰化位点。
其他文献
<正>我国开展空间环境探测已有30余年的历史。早期的实践一、二号、四号、五号、大气一号科学试验卫星、东方红二号、风云一号、风云二号等应用卫星对空间环境开展了尝试性探测和针对空间环境效应开展专题探测。
会议
随着新课程改革的逐渐推进,课程资源在教育教学中的地位逐渐凸显。时政资源作为高中思想政治课的重要课程资源之一,其具有的导向性、时效性、丰富性的特点能够有效弥补教材内容滞后的弊端,以新时代的教学内容与话语体系吸引学生的学习兴趣,引导学生积极思考,培养学生的思想政治学科核心素养。同时,在《普通高中思想政治课程标准(2017年版2020年修订)》中也明确指出,高中思想政治课程应与时事政治教育相互补充,共同
近年来高考生物学试题十分重视对生态文明观的考查,这是新时代提升学生生态文明素养的必然要求。本文以2020—2022年高考生物学部分试题为例,对生态文明观类试题进行探析,并提出高考生物学试题中融入生态文明观的教学启示。
<正>数字化方面我国企业依旧处于启蒙阶段。企业对于数字化和数字资产的认知较低,通过新一代信息技术有效管理和运营的意识较差,企业数字化转型尤为严峻。制造企业数字化转型必要性在我国传统制造企业经历了近二十年的智能化和信息化发展,目前已逐渐实现了企业的信息化管理和生产制造环节的智能化。尤其在航空航天、生物医药、汽车制造、石油化工等科技性较强、工业智能化需求较高的产业已经逐渐实现了生产制造全过程的智能化管
期刊
近年来随着大众旅游的不断发展,城市旅游导视系统在旅游业发展中占据着越来越重要的地位。以西丰县为例,对城市旅游导视系统的设计原则、设计要素及设计方法等进行了探究,并从文化元素的角度出发,设计出一套完整的、智能的、独具特色的城市旅游导视系统,以期提升西丰旅游形象,增强旅游竞争力,促进旅游业发展,同时为中国其他城市旅游导视系统的规划设计提供借鉴和参考。
实现共同富裕关键在于提升相对贫困群体的内生发展动力。基于2012—2018年中国家庭追踪调查(CFPS)数据系统测算农村家庭的相对贫困恢复力,实证检验互联网使用对农村家庭相对贫困恢复力的影响及作用机制。研究发现:互联网使用有效提升了农村家庭的相对贫困恢复力;互联网使用能够通过促进劳动力职业分层、缓解银行信贷约束和拓展家庭社会网络对农村家庭相对贫困恢复力产生积极影响;相较于中、青年家庭和东、中部地区
本文运用实验法,对体育游戏提升小学生体育学习兴趣及身体素质展开了实验研究,选取小学四年级两个班作为实验对象。其中对照班运用传统流线型为主的教学模式,实验班运用体育游戏与传统体育教材相结合的教学模式;选取同样的教材内容,设计两种不同的教学方案,进行为期14周的教学实验。在体育学习兴趣研究中,对实验班与对照班男、女生的四项体育学习兴趣维度进行实验前后测,利用汪晓赞教授研制的“小学生体育学习兴趣评价量表
利用常规气象资料、加密气象自动观测站资料及NCEP再分析资料对2020年9月2—3日发生在抚顺地区的“美莎克”(2009号)台风暴雨过程进行了诊断分析。结果表明:东北冷涡携带的干冷空气与低层台风系统输送的暖湿气流相互作用,易触发对流不稳定,这有利于中尺度暴雨云团的发展;东北冷涡的位置以及携带的冷空气强度直接影响台风造成的降水强度;强降水发生在高低空急流耦合上升区。强降水时段对应冷中心和垂直速度的极
因为我国各个高校英语翻译专业在开展教学活动过程中采用的教学方法还存在一系列弊端,致使英语翻译专业的学生不能熟练地掌握基础知识,毕业之后不能快速适应工作。由此可以表明,我国高校英语翻译专业教学方法急需创新。按照翻译目的论的原则,翻译目的是英语翻译的首要原则,这是翻译进入到所处语境文化中,翻译所实现的目标可以直接影响整个翻译的行为。所以,在目的论的引导下,通过创新与完善高校英语翻译专业教学的方法与策略