基于多视角特征融合的蛋白质属性预测

来源 :南京理工大学 | 被引量 : 0次 | 上传用户:EAGLE1205
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是构成生物体的重要物质基础,生命现象主要是通过蛋白质的结构和功能来实现的。掌握蛋白质的各种属性对于理解蛋白质功能,了解生物体内各种生化反应、基因表达,以及具有针对性地进行药物开发等方面有着非常重要的意义。   随着人类基因组计划的开展,到目前为止,美国最新公布的GenBank数据库版本中DNA序列的总量已经超过1265亿个碱基对。与其同步增长的还有已知蛋白质序列的数量,生命科学已经实质性地进入了后基因时代。   基于传统的生化实验来确定蛋白质的属性,复杂性高,实验周期长,效率低,不能满足后基因时代蛋白质序列海量呈现的迫切需求。因此,研发有效的算法,从序列来直接预测蛋白质属性就成了一件重要的工作。如何提取蛋白质特征则是其中最重要的方面之一。已有的研究表明,单视角特征不能反映一条蛋白质的所有信息,融合多视角特征是提高预测精度的一种有效途径。本文中,我们提出了一种新的并行框架,用于蛋白质多视角特征融合:首先,从不同视角获得的特征并行融合为一个复杂的特征向量;然后,我们使用广义主成分分析(GPCA)方法,用于从位于复空间中的融合特征中进一步提取蛋白质特征;最后,使用提取出的特征进行蛋白质属性预测。基于不同基准数据集的实验结果验证了该方法在蛋白质属性预测中的有效性。
其他文献
用户的情感信息在人机交互中起着重要的作用,自动情绪识别的应用可以使人机交互变得更加智能和友好。近年来,基于脑电的自动情绪识别受到了广泛关注并涌现出大量成果,但其在
P2P技术一项最重要的应用就是P2P网络,P2P网络“无中心化”的特征使得其不断受到人们的关注。然而,随着网络规模的扩大,越来越多的恶意节点加入其中,使得网络中存在较大的安全隐
在布料模拟中,为了达到较高的真实感,一般采用物理模拟的方法,虽然物理模拟方法可以得到高精度的结果,但通常需要花费较高的计算代价,因此效率和精度的权衡是需要关心的最重
近些年来,随着显卡技术的高速发展以及性价比的提升,将GPU用于通用计算逐渐成为国内外研究的热点。早期的GPGPU开发使用GPU的图形学接口,开发难度大、成本高。NVIDIA公司推出
敦煌飞天艺术有着深厚的文化内涵和强烈的艺术感染力。但是目前在飞天动画的制作方面存在流程复杂,制作耗时,技术要求高等问题。而且在动画制作过程中也缺乏对飞天飘带运动模
伴随着数字多媒体技术和设备的快速普及,使得人们获取和制作视频的方式更加容易,同时这些视频数据可以很容易的被人们通过视频编辑软件进行任意修改,使得互联网中充斥着各种
嵌入式系统开发、生产过程中涉及到的一个很重要的问题就是“镜像文件烧写”,镜像文件的烧写方案直接关系到嵌入式设备的开发、生产效率。目前国内很多嵌入式设备厂商的生产
情感分析是对文本中的观点、情感和主观性的计算处理过程。基于特征的用户评论情感分析是情感分析领域近几年出现的一个研究热点,它主要面向产品的用户评论,进行产品特征提取
近年来,网络海量科技文献知识库为科技工作者提供便捷的文献检索和学习研究服务,同时大量的作者同名现象降低了检索的准确性,因此作者消歧是该类知识库亟待解决的一个问题。
运动目标检测是计算机视觉领域的一个研究热点运动目标检测是将视频画面中的前景目标提取出来,得到前景目标的相关信息,是目标跟踪和识别安全监控等视频处理的基础,检测结果直接