基于目标检测的蛋白质结构域预测算法研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:kaida111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着生物信息学的不断发展,蛋白质残基接触预测和蛋白质结构域预测的研究也越来越多,准确率也越来越高。蛋白质残基接触图包含了蛋白质二维结构和三维空间距离信息,是研究蛋白质三维结构的重要步骤。蛋白质结构域对于解析蛋白质结构和理解蛋白质进化与功能有很大的作用,预测蛋白质结构域是蛋白质结构预测的第一步。论文主要是利用蛋白质残基接触图对蛋白质结构域进行划分。首先改进了目前蛋白质残基接触预测最好的网络Respre,主要是对Respre进行了网络压缩,然后将目前流行的多尺度信息捕捉方法用于Respre。根据蛋白质结构域的序列索引与蛋白质残基接触图的对应关系设计了两个目标检测的标签,引导框和对角框,用于划分蛋白质的连续结构域和不连续结构域。然后设计了目标检测网络的核心组件锚框,锚框的宽高比由蛋白质结构域的真实标签框聚类得到,面积则是根据目标检测网络输出层的理论感受野求得。为了能够将目标检测网络预测的标签框坐标转换成蛋白质序列索引,论文制定了一套规则来对目标检测网络输出的坐标进行矫正。最后使用并查集数据结构将图像坐标转换到生物蛋白质序列索引。论文是首个制定了目标检测预测蛋白质结构域方案的工作,介绍了如何从蛋白质序列数据预测蛋白质残基接触图,提出了如何根据蛋白质残基接触图使用目标检测预测蛋白质结构域。论文对Respre网络的改进提升了Respre预测蛋白质残基接触的性能。然后论文提出的基于目标检测预测蛋白质结构域的方法在CASP生物公开数据集上划分出的连续结构域和不连续结构域的准确率都要高于目前最好的方法Threadom。
其他文献
随着环境问题的日益严重,水污染防治成为国家和社会关注的重点。目前城市污水大多采用生物处理,并通过活泥镜检的方式对处理结果进行检测。然而,传统的活泥微生物镜检大多是人工检测的方式,无法对数据进行快速处理和分析。近年来,作为人工智能的重要分支之一的计算机视觉迅速发展,将视觉计算的方法引入到活泥微生物镜检的过程中,能够快速检测出反映水质状态的指示生物的存在、消失以及运动特征变化,更加高效的检测水质状况。
学位
命名实体识别作为自然语言处理中的基础内容,其任务是从待处理的文本中识别出具有特定意义的实体,其识别结果对于自然语言处理后续工作有着很强的关联性。中文命名实体识别的主要任务是识别出中文文本中人名、地名和时间等等通用实体,且在专业领域中,命名识别的准确率也尤为重要,例如网络攻防领域信息抽取,智能问答系统,情感分析等任务。命名实体识别在这些专业领域自然语言处理任务中是一项既基础又关键的一环。使用传统方法
学位
互联网的发展给各行各业都带来了新的机会和挑战,也提供了一个面向全世界用户的信息交互平台。人们逐渐习惯在互联网上发表意见和评论,表达自己的观点。随着互联网应用的持续高速发展,海量的文本内容在网络上存储和流转,包括了产品评论、个人微博、热点舆论等信息。这些文本中蕴含了一些有价值的信息,由于人工整理已经很难适应迅速增长的文本信息规模,如何高效准确地提取有价值的信息,成为了一个新的研究课题,情感分类是其中
学位
作为高效便捷建筑信息模型软件的探索,实现一个高效浏览器端模型交互平台,既能够在便携电子设备上使用,同时也保持了多端表现一致,不必为特地为某一终端开发定制化软件。而为了解决在大型建筑模型在电脑浏览器上,输出帧率过低,显示卡顿,浏览体验差的问题。通过基于混合空间划分的视锥剔除技术和层次细节技术的结合来达到提升输出帧率,流畅显示,良好浏览体验的目标。基于混合空间划分的视锥剔除技术,基本思想是在视锥剔除的
学位
随着“大众创业,万众创新”的势头风生水起,创业正在成为一种新常态,各地政府也在不断出台新政策为创业的人清除障碍。在这样一种全民创业的时代背景下,诞生了大量的创业孵化社区。虽有很多创业孵化社区的存在,但目前存在的创业孵化社区管理系统不仅功能单一、而且交互性差,难以满足社区的需求。基于此目的,一个集功能齐全与交互性良好为一体的创业孵化社区管理系统应运而生。系统采用B/S架构,利用Spring Boot
学位
伴随着移动互联网的发展,越来越多的信息以电子形式存储在移动设备当中,如何有效地保障这些信息的安全是值得各方重视的问题。一般认为对文件进行加密能够较为有效的保障信息的安全,而在各类文件中以视频类型的文件结构最为复杂、蕴含的信息最为丰富,所以对视频文件加密技术的研究具有较为重要的地位。视频文件有其自身的特性,而大部分的传统加密算法并没有在加密过程中针对其特性对视频文件和其他文件进行区分,导致传统加密算
学位
在工业生产中,标准的工作着装是安全工作生产的重要保障,在建筑工人、电力维修、交警等工作群体中显得尤为突出。为了降低工作中的安全隐患,目前,对工作人员的安全帽,工作服等着装检测,大多停留在领导抽查的状态,监管效力有限。为了降低人力成本,针对在电力场景下的实际应用,系统采用Alpha Pose网络模型来检测人体骨架,在确定人体骨架后,对如头部、身体、脚等部分进行分类处理。通过Alpha Pose网络模
学位
社区是复杂网络中的一种内部紧密连接,外部稀疏连接的结构。社区发现就是在复杂网络中找出社区结构。图神经网络是一种用于处理图数据的神经网络,其中的图卷积网络(Graph Convolutional Networks,GCNs)和图注意力网络(Graph Attention Networks,GATs)近年来逐渐被运用于社区发现任务。此外,还有将马尔可夫随机场模型(Markov Random Field
学位
图像识别技术属于图像处理技术的范畴,是模式识别中的一种。图像识别技术已经落地使用于实际的生活当中,比如交通、金融、安防等领域。该技术的原理就是对一张图像,在给定的图像类别集合中,找出一个和该图像匹配度最高的类别,然后作为该图像所属类别的结果。提升有关图像识别算法的准确率,减少识别消耗的时间有着重大的研究意义,对技术的落地应用都有着深远的影响。本文的主要内容是基于主成分分析和线性判别分析的图像识别算
学位
虚拟资源是互联网企业最重要的产品之一,对于这些资源的集中管理是十分必要的。某公司某部门主要负责该公司一些关键的虚拟资源,每年这些虚拟资源都会带来很大比例的营收。该部门最初只有一种虚拟资源,随着业务的扩展,在原来的基础资源上逐渐开发出了多种衍生虚拟资源。另外,节假日的时候,该部门为了增加收入,会进行一些营销活动,需要一次性给用户发放多个虚拟资源。原有的直接调用各个虚拟资源提供的接口的模式,随着虚拟资
学位