基于谱分析方法的蛋白质检索框架及性能研究

来源 :长沙理工大学 | 被引量 : 0次 | 上传用户:GoldGhost
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质是生物过程的大分子,具有动态和复杂的表面。由于局部或全局结构的变化,它们会表现出多种不同的构象,这些结构变化会极大地影响它们的全局和局部形状。蛋白质的不同构象以及动态变化给三维蛋白质的检索带来了挑战。本文以3D蛋白质模型检索为研究背景,为了提高三维蛋白质模型检索精度,本文提出了一种新的检索框架以及新的检索方法,主要开展了以下工作:(1)本文以3D蛋白质模型检索为目标,设计了三维蛋白质检索框架,检索框架大致分为四步:第一步,对查询分子进行预处理生成3D网格模型;第二步,分别用四种谱描述符训练生成码书;第三步,根据码书大小以及每个点的原始向量计算出BoF;第四步,生成相似蛋白质列表。在此框架基础上分析了四种谱方法在三种不同类型分子数据集上的性能,它们分别是 Heat Kernel Signature(HKS)、Glogal spectral graph wavelet(GSGW)、Wave Kernel Signature(WKS)、Scale-invariant heat kernel signature(SIHKS),并通过实验结果,基于检索框架的谱方法的检索性能有着极大的提高,论证了检索框架的有效性。在该框架下分析了蛋白质模型面以及词典大小与算法检索性能之间的关系。(2)单个算法在蛋白质数据集的检索效果并不理想,为了提高检索性能,提出了一种新的基于混合谱特征的蛋白质形状检索谱方法,该方法结合了 Wave Kernel Signature(WKS)和Heat Kernel Signature(HKS)即混合谱算法。混合谱算法是WKS算法以及HKS算法分别计算BoF,并将两个归一化后的向量合并成一个向量作为算法的新特征,对混合谱算法和现有的几种形状描述算法在三个不同类型的分子数据集上进行了综合比较。实验表明,该算法比单一的算法的检索效果更好,并优于几种对比的形状检索算法。
其他文献
基于金纳米材料的模拟酶是众多纳米酶中重要的分支之一,它不仅被广泛地用于光动力治疗的研究,而且在高效、灵敏的目标物即时检测中也扮演了十分重要的角色。然而,多数金基底
本论文分为两部分。第一部分,S-N-乙基-2-氨甲基吡咯烷的合成工艺研究;第二部分,二羟基色酮茚并吡咯香豆素衍生物的合成。第一部分内容分为两章,第一章简要介绍了抗精神病药
一、背景与目的黄酮类化合物是一类在自然界广泛分布,具有生物活性的多酚类物质,在人类日常饮食中多有摄入。黄酮具有抗氧化、抗炎和抗肿瘤等药理活性,数十年来一直作为潜在
面对世界百年未有之大变局,以习近平同志为核心的党中央提出了一系列转变经济发展方式和推动消费提质升级的新思想和新论断,其中就包括指导推进国际消费中心城市培育工作。20
森林火灾严重危害森林生态系统,为此,如何有效的防范和扑救森林火灾是森林经营管理者关注的一个重要内容。随着遥感影像技术的快速进步与普及,人们发现,利用遥感卫星监测森林
目前波能技术尚未成熟,没有商业化。现在研究主要集中在装置的布放、运维及输电系统等方面,这些技术已趋于成熟,接近商业化水平。但现有技术波能转换效率很低,已成为阻碍波能技术发展的瓶颈,提高波能技术的转换效率成为其关键问题。波能装置在共振状态下的俘能效率非常高,这已为理论和实验所证实,研究者为了利用这一机理做了大量的研究,然而现有的波能装置难以在实际海况下实现共振,显然其中的一些机理尚未厘清。主动共振波
海冰是全球气候系统的重要组成部分,在调节海洋和大气的热量和辐射平衡方面发挥重要作用,海冰的研究对于了解全球气候系统以及海冰的变化对生态系统的影响至关重要。IceBridg
中秋酥脆枣是湖南枣的主栽品种,发展面积约670公顷,果斑病是中秋酥脆枣的重要果实病害。为了探究中秋酥脆枣果斑的形成原因、发病规律以及防治方法,通过环境与气象调查结合体
近年来,互联网环境为众包提供了强大的技术支持,众包已经成为一种开放式的创新模式。现如今,众包已深入到许多行业领域,出版领域也不例外。自2011年起,国内外陆续出现了多家
煤与瓦斯突出灾害严重威胁着煤矿的安全开采,水力冲孔卸压增透技术可以有效提高瓦斯抽采效果、减少煤层残余瓦斯含量。然而,目前钻孔倾角对钻孔周围煤岩体的应力演化及瓦斯运