基于深度学习组合模型的蛋白质二级结构预测

来源 :齐鲁工业大学 | 被引量 : 0次 | 上传用户:Roy163
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在生物信息学领域,蛋白质二级结构预测一直是研究的热点。蛋白质是人体生命活动的主要载体,因此深入理解其结构将有助于相关疾病的治疗及新型药物的研发。本文主要采用了三种不同的深度学习组合模型来提高蛋白质二级结构预测的准确率,主要工作包括以下三个方面:(1)基于WS-Bi LSTM网络模型的分类方法。本文提出了一种新的模型WSBi LSTM,结合了小波散射卷积网络和双向长短时记忆循环网络(Bi-LSTM)来预测蛋白质的二级结构。该模型捕获氨基酸序列之间的非局部相互作用并记住氨基酸序列之间的长程相互作用。在WS-Bi LSTM模型中,小波散射卷积网络从PSSM滑动窗口中提取蛋白质特征,提取的特征与原始PSSM数据相结合,作为Bi-LSTM的输入特征,送入到模型中预测蛋白质二级结构。在测试集CASP9、CASP10、CASP11、CASP12、CB513、PDB25上的Q3准确率分别达到85.26%、85.84%、84.91%、85.13%、86.10%和85.52%,比只使用Bi-LSTM分别高2.15%、2.16%、3.5%、3.19%、4.22%和2.75%。将本模型的结果与最先进的方法进行比较,证明我们提出的模型在CB513和CASP12数据集上取得了更好的结果。实验结果表明,从小波散射卷积网络中提取的特征可以有效提高蛋白质二级结构预测的准确性。(2)基于小波散射卷积网络和时序卷积网络(TCN)的分类方法。本文首次将小波散射卷积网络和TCN组合进行蛋白质二级结构预测。本模型以滑动窗口的方式对数据进行处理,利用小波散射卷积网络对蛋白质序列局部相互作用进行特征提取,充分发挥TCN灵活的感受野和不会产生梯度相关问题的优势,以完整的蛋白质序列作为输入。在公共测试集CASP9、CASP10、CASP11、CASP12、CB513和PDB25上的Q3准确率分别达到85.82%、86.33%、85.46%、85.68%、86.71%和85.97%,比单独使用TCN分别高2.06%、2.04%、3.16%、3.07%、4.29%、2.42%。实验结果表明,本模型有效的提高了蛋白质二级结构预测的准确率。(3)基于Morlet小波和Bi-LSTM的分类方法。本文首次提出了结合Morlet小波和Bi-LSTM预测蛋白质二级结构。本模型延续了前两章“序列-滑动窗口-序列”模式的数据处理流程,首先将蛋白质序列划分成滑动窗口送入到Morlet小波,提取到不同尺度的特征,将提取到的特征按序列模式与原始蛋白质序列融合,送入到Bi-LSTM进行预测。实验结果表明,本模型取得了较好的分类结果。
其他文献
孪生诱发塑性(Twinning-induced Plasticity,TWIP)钢具有优异的强塑性、良好的成型性及较好的抗撞击能量吸收能力等优点,受到人们的广泛关注。然而TWIP钢屈服强度较低,限制了其在工业上的广泛应用,如何提升其屈服强度是目前TWIP钢发展过程中需要重点关注的问题。本文以Fe-Mn-C及Fe-Mn-C-Si钢为对象,通过冷轧及温轧变形的方式,调控初始组织中的孪晶和位错等缺陷含量
学位
Fe-Ni基合金(32%-36%Ni)具有较低的膨胀系数,可用于制造精细的仪器仪表、电子器件等领域,然而其强度较低,可以通过第二相强化的方式来提高强度,本论文通过在Fe-33Ni合金的基础上添加质量分数为6%的Al,获得成分为Fe-33Ni-6Al的合金,Al的添加会引起组织发生变化,生成NiAl系的金属间化合物,同时可以使合金减重,使用金相显微镜、扫描电子显微镜、透射电子显微镜、X射线衍射仪研究
学位
信息技术的高速发展让世界实现万物互联,同时也导致数据量呈指数倍快速增长的情况发生,并且与传统静态数据不一样的是,现在的数据具有实时、海量、易失等特点,我们称之为流数据。传统的聚类算法无法满足对这种流式数据的处理需求,所以,流数据聚类算法的研究变得尤为重要。随着分布式处理框架的出现,处理数据量大且实时的流数据变得越来越高效。同时,不同的聚类算法会产生不同的效果,如何针对某一特定数据类型的数据集合来选
学位
本文主要采用SEM、XRD、EBSD和TEM等多种组织结构表征手段,研究热轧温度、热轧压下量、热轧道次、热轧速率、热轧冷却方式等热轧工艺参数和热轧前的预处理工艺对Fe49.5Mn30Co10Cr10C0.5高熵合金显微组织的影响。实验结果表明:控制热轧工艺参数和热轧前预处理工艺,能控制热轧后的显微组织,包括相的形态、数量和分布,基体的带状结构和再结晶程度,孪晶分数,晶粒尺寸及其分布的均匀性,并获得
学位
Mg-Zn-Zr(ZK)系列镁合金是近年来备受关注的一类新型高强镁合金,其典型代表ZK60镁合金已经在诸多工业领域得到了广泛的应用。ZK30镁合金相较于ZK60镁合金铸造性能更好,冶炼成本相对低廉,但是由于主添加元素含量的降低,导致其强度和塑性低于后者,同时由于铸造过程中的凝固缺陷,进一步使得铸态ZK30镁合金的可塑性和机械性能降低。搅拌摩擦加工技术被认为是一种能够细化组织,提高材料综合力学性能的
学位
随着我国“互联网+”新经济形态的推进,社会基础资产全面互联网化,企业网络空间安全问题备受关注。为了培养学生处理学习和工作中遇到的信息安全问题的综合能力,建设一个高质量的网络安全综合学习平台是十分必要的。本文提出了一个网络安全综合学习平台的建设方案,并对网络安全实验室、网络安全学习平台网站、视频自主学习网站、攻防靶场、渗透靶场、CTF训练网站、网络攻防比赛训练平台提供解决方案。实践的结果表明,采用该
期刊
壳聚糖(Chitosan)是2-乙酰胺基葡萄糖(甲壳素)的脱乙酰基衍生物。因其具有无毒、可生物降解、相容性好、易成膜、抗菌性强等独特的优点而被广泛的应用于环保、医疗、食品等诸多领域。然而,由于壳聚糖分子间相互作用较强,分子链柔顺性差而导致其力学性能不佳,这在很大程度上限制了其应用。本文以调控壳聚糖分子间的相互作用为切入点,开展了如下研究。首先,基于氢键相互作用探索了深共晶溶剂(DES)对壳聚糖薄膜
学位
本文以Al-Mn基准晶近似相为主要研究内容,成功合成一系列复杂合金相单晶,通过单晶X射线衍射进行了结构的解析和精修,并从拓扑学角度分析了Al-Mn及Al-Mn-Ni体系中复杂合金相的基本构建单元,探索其中的联系与区别。首先,在Al:Mn原子比为2:1的高温烧结样品中发现了γ-Al8Mn5相,其晶胞参数为:a=b=12.6751(13)?,c=7.9137(9)?,α=β=90°,γ=120°,空间
学位
电解水是制备氢气的重要工艺方法之一,实现工艺所需的电能可以通过多种可再生能源转化而来,工艺原料是地球储量丰富的水资源,是一种真正清洁的制氢手段。但自然条件下电解水反应耗能高、产氢效率低,远远不能满足工业需求。目前,通过对电解电极改性形成有催化性能的电极可以有效解决上述问题。本课题选用厚度0.2 mm的铜片作为电解电极基底,利用电化学沉积手段引入镍元素,通过调节电镀液成分、沉积电流、沉积时间等实验条
学位
<正>电力产业是关系国计民生的重要基础产业,承担着建设、运营、数据安全等多种任务,是国家级网络攻击重点打击的对象。随着以风能、太阳能为代表的新能源的发展,尤其是近两年来,针对新能源行业的网络攻击事件并不鲜见。例如,2021年,Vestas遭遇网络攻击,导致大量数据泄露;2022年2月,德国风电机组制造商ENERCON Gmb H宣称网络攻击破坏了其装机容量总计11GW风电机组的集中远程控制系统。新
期刊