基于图的蛋白质不连续结构域预测算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:lrh791020
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
结构域作为蛋白质三维结构中重要的组成部分,对蛋白质的功能具有直接影响。准确识别蛋白质结构域对蛋白质结构解析至关重要。传统的试验方法测定蛋白质结构域,虽然准确、可靠,但是成本高、效率低。对蛋白质不连续结构域预测研究有助于蛋白质三级结构测定和功研究,对疾病发生机制理解和开发新的药物具有重要的意义。基于序列的研究方法很少考虑到不连续结构域检测问题,基于结构的方法虽然大多都能考虑到不连续结构域边界划分,但是比较依赖于蛋白质三维结构。不同于以往的研究思路,基于图的蛋白质不连续结构域预测算法从序列出发,结合图相关方法进行结构域边界预测,最终对不连续结构域进行检测。研究思路:首先从序列出发,结合深度学习算法预测残基接触图,并根据残基接触图确定蛋白质接触图。之后,提出两种算法对蛋白质接触图进行递归分割,得到结构域边界信息。最终,通过结构域检测算法对不连续结构域进行检测。第一种分割算法是基于最大流的方法,该方法对图进行递归分解,直至分解后子图满足终止条件,算法结束。提出的第二个算法是基于费德勒向量方法,该方法跟第一种方法流程大致相同,不同点在于,该方法通过计算图的拉普拉斯特征值中次小拉普拉斯特征值和费德勒向量,在每次分割的时候,需要根据费德勒向量值遍历分割结果,选取最优的分割结果为当前分解结果。结果表明,对于不连续结构域预测问题,基于费德勒向量方法在精确度、召回率、NDO-score和DBD-score均优于基于最大流方法,并且在精确度、召回率和NDO-score方面优于ThreaDom方法。因此,可以证明基于图的蛋白质不连续结构域预测方法是合理可行的。
其他文献
碳(C)、氮(N)和磷(P)是维持植物正常生长和发育所必须的养分元素。同时,植物C、N和P化学计量特征与陆地生态系统C交换以及养分循环密切相关,能够反映出生态系统对于外界环境变化的响应。随着人口增加以及农业技术的日益发展,人们对草地的利用强度愈来愈大,如外源氮、磷养分输入(施肥),放牧和刈割,这些人为干扰均会严重影响陆地生态系统。草地作为陆地生态系统的重要组成部分,对日益增加的人口食物供应有着重要
大型无缝环件广泛应用于火车、船舶、航空航天等工业领域。国家航天重大科技工程——运载火箭所需的关键结构件便是大型铝合金环形件,随着国家航天事业的发展,对高性能大型铝合金环形件提出迫切需求。在环件轧制中,微观组织预报对预测力学性能具有积极意义。由于动态再结晶会影响环件轧制后的晶粒尺寸,这就需要研究大型环件在径轴向热环轧间隙时间内的动态再结晶行为,所以亟需建立动态再结晶动力学模型并确定适合动态再结晶的变
胆碱是反刍动物机体必需的重要营养物质,其参与体内多种代谢过程。胆碱对奶牛生理性能的调控发挥着重要作用,如提高乳品质、促进脂质合成、预防脂肪肝、调控能量负平衡等,但是目前胆碱对反当动物肉用性能的研究较少且结果不尽一致。探索反当动物日粮中胆碱的适宜添加量,对其生长性能、饲料利用率及代谢性能的影响具有重要研究意义。本研究以过瘤胃保护胆碱(Rumen protected choline chloride,
地球是人类的家园。地球的自转运动以及其绕太阳的公转运动是地球运动的重要形式,与人类的生活休戚相关。地球自转是天文学与地球科学相互交叉、相互渗透的一个分支学科。对它的研究除了具有重大理论意义外,还具有明显的实用意义,例如:对地球自转速率变化和地极移动或地极摆动(极移)的研究,关系到确定地面观测站在宇宙空间的精确位置,以及地球参考系在准惯性空间的指向,这是地面精密测绘和空间飞行器跟踪所需要的参数;板块
苹果(Malus domestica Borkh.)是蔷薇科(Rosaceae)苹果属(Malus)多年生木本植物,是世界上主栽果树之一,同时也是我国最主要的果树树种之一。苹果在生长发育过程中会遇到各种生物和非生物胁迫的影响,其中干早胁迫和盐胁迫会导致植株出现氧化胁迫反应,从而抑制植株的生长发育、降低果实品质。非生物胁迫相关基因在响应植物对干旱、盐害等逆境胁迫过程中,发挥着至关重要的作用。已有研究
在过去的二十年中,双极电极(BPE)被广泛应用于化学和生物分析、材料合成、和催化剂筛选等领域。在化学和生物分析及催化剂筛选领域,BPE上的电信号通常用电致化学发光(ECL)、电致变色以及荧光反映出来。其中,ECL以其低背景干扰、操作简单、高通量和可视成像能力等突出优点,是目前应用最广、也是最受欢迎的一种检测方式。而通过对双极电极的阴阳两极进行一定的修饰,可调节双极电极上的电化学信号,从而使得ECL
X射线通导测一体化卫星有任务多样,参数众多,接口丰富等特点。因此传统卫星不能满足X射线通导测一体化卫星的需求。而软件定义卫星是以软件为手段,将传统卫星上由分系统实现的通信,载荷等功能软件化,便于通过软件实现卫星的在轨重构,以此适应不同的任务需求。软件定义卫星的设计理念是将卫星硬件和卫星软件解耦合,设计模块化的硬件,有助于实现软件定义卫星的快速集成与装配,为卫星的产品模块化生产,灵活性配置,快速响应
高光谱图像异常检测技术是高光谱遥感图像处理领域的热门研究课题,相关研究已成功应用至环境监测、稀有植物保护、军事伪装和隐藏识别等领域。然而,受成像平台误差、大气环境等因素的影响,高光谱图像存在背景成分复杂、数据冗余、先验信息欠缺等问题。为缓解或者克服上述问题对异常检测性能表现带来的影响,本文深入分析了高光谱遥感图像的数据特性,设计了两种基于对抗学习的高光谱异常检测算法,分别从无监督特征提取和半监督背
伴随遥感技术的发展,遥感图像被广泛应用到变化检测、遥感解译等领域。但是,遥感图像匮乏、质量不佳以及多样性不足的问题限制了遥感解译等后续研究的性能提升。众多研究表明,数据增强是解决上述问题的有效手段。该方法通过学习训练样本的数据分布,合成逼真的遥感图像,达到数据扩充的目的。因此,本文基于生成对抗网络,构建了两个用于遥感数据增强的图像生成模型,可以生成富有变化的高质量图像,并大大缩短生成时间,为遥感解
神经网络是一门十分重要的机器学习技术,它是人工智能领域目前最为火热的研究方向之一。基于神经网络的人工智能技术依靠其强大的特征提取能力,在计算机视觉、自然语言处理等领域都取得了十分普遍的应用。然而,为了增加神经网络的推理准确率,网络结构发展日趋复杂,层数和节点数量日益增大,伴随而来的是参数量和计算量的急剧增加,这对硬件平台的数据带宽和计算能力有较高的要求。基于神经网络计算处理高度并行这一特性,GPU