基于深度学习的蛋白质丝氨酸ADP-核糖化修饰位点预测研究

来源 :青岛大学 | 被引量 : 0次 | 上传用户:liusha5188
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质翻译后修饰(Post-translational modifications,PTMs)通过对蛋白质的特定氨基酸位点与功能基团进行共价结合来增加蛋白质组的功能多样性。翻译后修饰对大多数的生物过程有着关键性的作用。其中,ADP-核糖化(ADP-ribosylation,ADPr)修饰是将ADP-核糖从烟酰胺腺嘌呤二核苷酸(NAD+)转移到基质蛋白上并释放烟酰胺(Nam)的修饰过程。ADP-核糖化修饰调节许多关键的细胞过程,发现ADP-核糖化的蛋白质靶点氨基酸的修饰可以调节真核生物的关键细胞通路,并为某些细菌的致病性奠定基础。因此,能够从大量的蛋白质序列中准确的识别出ADP-核糖化的修饰位点,不仅能够促进ADP-核糖化的修饰功能与生物作用的研究,还能为临床试验及药物研究提供支持。同大多数的翻译后修饰特点相同,ADP-核糖化修饰的丰度非常低,从而对此修饰的鉴定变得非常困难。随着抗ADP-核糖化修饰抗体的广泛应用结合色谱质谱联用技术,大量的ADP-核糖化修饰位点被鉴定出来。然而,实验操作具有过程复杂且费用高的缺点。随着机器学习技术的发展,有必要基于已鉴定的数据,开发预测模型来确定ADP-核糖化修饰位点。所以,针对目前并没有基于丝氨酸ADP-核糖化修饰位点预测工具的现状,本文进行的主要研究工作如下:(1)构建了丝氨酸ADP-核糖化修饰的数据集:通过收集基于质谱的实验数据并检索标准蛋白质序列数据库(Uniprot),进行数据清洗来满足建模的要求。(2)丝氨酸ADP-核糖化修饰的特征提取和模型构建:从数据集中提取不同的特征并开发了四个基于传统机器学习算法的分类器以及八个基于深度学习算法的分类器。计算结果表明基于二进制编码的随机森林模型在构建的传统机器学习算法有最好的预测性能,而基于单热编码和词嵌入向量的两个卷积神经网络模型在所有的算法中性能表现最优。(3)在丝氨酸ADP-核糖化修饰位点预测的研究问题上,混合最优的两个深度学习模型构建了预测模型Deep ADPr S,通过十折交叉验证和独立测试,Deep ADPr S在所有模型中表现最好,ROC曲线下与坐标轴围成的面积分别为0.935和0.932,并通过可视化展示来体现Deep ADPr S的优秀预测性能。为了进一步体现Deep ADPr S的性能,本文探讨并使用已发表的基于天冬氨酸(Asp,D)以及谷氨酸(Glu,E)的修饰位点数据,结果表明Deep ADPr S有最高的预测性能。(4)开发了基于Deep ADPr S的丝氨酸ADP-核糖化位点预测在线网站。
其他文献
情感分析作为NLP领域的子任务,通过文本内容计算出对应的情感极性,已在社交平台、电商平台及舆情分析多个领域得到应用。传统的情感分析中只对于文本进行整体分析,给出单一的情感倾向,而对于评论文本中出现多个不同的评价方面且对应的情感倾向不统一时,其所达到的效果已经不能满足人们当今个性化需求。而细粒度情感分析是有针对性的对文本中出现的细粒度级别的方面进行情感倾向的判断,更加全面的反映评论文本的潜在信息,为
计算机视觉处理技术近年来发展迅速,并逐渐在人们的日常工作和生活中发挥重要作用,但计算机处理视频能力的发展速度无法同视频数据快速增加的速度相匹配,这直接导致使用计算机无法及时筛选和处理真正有用的视频数据。因此,预先对视频内容进行筛选,已经成为迫切的实际需要。视频显著性物体检测技术就是实现对视频有用内容预处理的最佳解决方案。视频显著性检测的主要目的是将人眼感兴趣的区域从背景中分割出来,目前基于神经网络
慢性肾脏疾病(CKD)是一种发病率和死亡率都很高的疾病,在几个月到几年的时间里肾功能逐渐丧失,目前已成为广受关注的世界公共卫生问题。早期发现、及时干预可以明显提升慢性肾病患者的生存率。然而,当前最常用的检测手段是医生利用超声图像数据进行阅片诊断,这种方式一方面耗费医生大量的时间精力,每天面对庞大的门诊量医生工作压力较大,另一方面医生的诊断判断易受到自身学识、经验以及认知水平等主观因素影响,使得慢性
相比较传统医疗设备,植入式医疗设备能够更加精确方便地获得人体病理数据,成为医疗电子领域关注的焦点。随着微电子技术的不断进步,植入式医疗设备尺寸向小型化方向发展,对天线小型化提出了更加严格的要求。天线植入在不同的人体部位,具有不同的电磁参数,为了适应各种人体环境,需要天线具有宽频带特性。本文针对植入天线设计的小型化与宽频带问题,开展了工业科学与医疗频段(Industrial,Scientific,a
“图形与几何”作为初中数学四大板块“数与代数”、“图形与几何”、“统计与概率”、“综合与实践”之一,在数学教育中具有举足轻重的地位。而在众多几何模型中三角形模型所占比重最高,且又与全等相似、旋转平移、轴对称中心对称等知识有着密切联系,是后续学习平行四边形、圆等必备知识基础。因此,学生对于三角形模型的认知程度可以作为评判学生几何能力高低的重要标准。本文利用范希尔理论中的五水平划分法编制测试卷对学生的
随着社会的快速发展,人们对医疗卫生的服务质量和工作效率提出了更高的要求,而药房作为医院不可或缺的一部分,其自动化、信息化、智能化升级尤其重要。自动化药房在发达国家发展的早,产品成熟且普及程度高。近年来,国内越来越多的大型医院开始引进自动化药房设备,国内的药房自动化系统研发和应用正在快速发展。本文通过对国内外自动化药房发展历程和机器人视觉技术研究及应用现状的分析,理清了自动化药房的发展趋势、涉及的关
水下环境不同于大气,水体密度远大于大气导致其中悬浮粒子更多,让水下传播的光面临更强的吸收和散射效应。水下拍摄的图像普遍受多类型模糊、对比度失真、严重的噪声和色偏等问题的影响,加大了水下图像分析与、理解与后期应用的难度。单幅水下图像往往同时出现多种质量退化问题,于是提升退化图像质量,恢复出清晰图像,对图像实践应用和科学研究具有重要意义。现存的复原方法和增强方法多数无法对多重的退化问题进行有效修复。针
随着目前传媒信息时代的发展,广告是被使用最广、最多的一种动画设计表现形式。素来以严谨、客观而著称的公益广告也衍生出更为多样化的表现形式,现如今通过动画呈现公益广告已经成为其发展的重要形式之一。科学技术的革新带动了动画产业的快速发展,当代社会中通过二维动画、三维动画、偶动画等常见的动画形式来传达公益广告的中心主旨的艺术作品屡见不鲜。本文以二维动画在公益广告中的运用为研究对象,在充分的理论研究的基础上
基于二阶导数的图像恢复变分模型可以同时保持图像质量和图像结构,但其规则项的非线性、非光滑性、甚至非凸性制约着算法的效率以及快速算法的设计。为求解凸优化问题,交替方向乘子法(Alternating Direction Methods of Multipliers,ADMM)将全局的优化问题分解为多个容易求解的局部子问题,通过交替迭代优化子问题的方式得到最优解。ADMM方法迭代成本较低,收敛速度较慢。
随着互联网的迅猛发展,数据量出现大幅度的增长,用户需要消耗大量的人力物力来管理和存储数据,云存储技术应运而生。用户之间持有相同的数据,云端就不得不存储海量的重复数据,造成数据冗余和云端存储资源的浪费,同时也使得数据传输效率大大降低。重复数据删除技术的出现,在节省存储资源和带宽的同时,也造成了去重效率低下和数据泄露等问题:(1)在重复数据删除的过程中会产生大量的计算机调度冲突问题,如何在保护用户数据