【摘 要】
:
蛋白质的空间结构决定着其功能,其空间结构的确定非常复杂。通过前人的研究表明获得蛋白质的结构类,可以确定肽链的折叠形态,从而缩小空间结构自然搜索的范围,为其结构测定提供了方向,节省了许多时间和物力。但结构类的预测准确率一直很低,特别是在低相似性序列数据集上。导致其预测率低的原因在于用传统的方法所提取结构类序列的特征信息中有很多冗余信息。基于此,本文的工作如下:(1)提出了一种基于降维的特征融合和迭代
论文部分内容阅读
蛋白质的空间结构决定着其功能,其空间结构的确定非常复杂。通过前人的研究表明获得蛋白质的结构类,可以确定肽链的折叠形态,从而缩小空间结构自然搜索的范围,为其结构测定提供了方向,节省了许多时间和物力。但结构类的预测准确率一直很低,特别是在低相似性序列数据集上。导致其预测率低的原因在于用传统的方法所提取结构类序列的特征信息中有很多冗余信息。基于此,本文的工作如下:(1)提出了一种基于降维的特征融合和迭代二维小波去噪的预测模型,称之为FU-ERD-IWD(Model 1)。它用来解决在蛋白质结构类预测过程中,高维特征向量融合后计算成本和冗余信息增加的问题。首先用二肽组成和三肽组成提取结构类序列的特征信息,然后用核主成分分析(KPCA)对其降维,将降维之后的特征向量进行融合。之后对融合的特征向量进行二维小波去噪,通过多次迭代去噪,去除特征向量里的冗余信息。虽然本预测模型的预测效果与其他文献有差距,但所取得的预测效果还是行之有效的。(2)提出了一种基于并行二维小波去噪和特征融合的预测模型,称之为PWD-FU-PseAAC(Model 2)。在蛋白质结构类预测过程中提出一种新的融合策略:先去噪后融合,来增强低维特征向量的有效性,使之更容易预测和识别。首先通过两种类型的伪氨基酸组成提取结构类序列的特征信息,然后对这两部分特征向量进行二维小波去噪,去除冗余信息。其次将去噪后的两部分特征向量进行融合。相比另一种融合策略:先融合后去噪,本文所提新的融合策略要更好。并与其他文献中的预测方法相比较,本预测模型的预测准确率更高,而且本预测模型有望应用于生物信息学其他领域。
其他文献
随着现代各种成像设备和技术的快速发展,包括各种光学成像系统和微波成像系统,数字图像数据的自动解译与识别技术成为现代先进成像系统应用于实际环境的支持。图像分割技术是
随着社会发展和高等教育要求的不断提升,各大高校为学生的学习和生活提供了良好的基础设施,如图书馆、体育馆等。针对这些基础设施的资源管理也变得十分重要。其中,高校体育
目的:构建兔源单链抗体噬菌体库,筛选免疫组化(IHC)用抗雌激素受体(ERα)抗体,探讨利用噬菌体展示技术筛选应用于免疫组化中高亲和力抗体的可行性。方法:用ERα重组蛋白免疫
随着多媒体时代的到来,人们对低功耗、高分辨率、宽色域的便携式显示设备的需求越来越旺盛。基于相变材料的显示技术由于其超快切换速度、高分辨率、低功耗和非易失性等卓越
在我国的行政体制中,乡镇政府是最基层的国家行政机关,是我国贯彻落实各项政策的重要基础,也是党和政府直接联系人民群众的纽带,是我们党执政的根基。乡镇公务员是政府一线工作者,是宣传和落实国家政策与方针的重要执行者,也是推进全面深化改革的重要力量。乡镇公务员长期为人民群众提供公共服务,并且承担着加强农村现代化建设、密切党群关系、维护农村和谐的重要责任,其服务质量会直接影响国家政策与方针的落实、党与政府的
本文提出了在短峰波作用下多孔介质海床土体孔隙水压力动态响应的弹塑性理论分析模型。首先推导建立了短峰波作用下海床震荡孔隙水压力与累积孔隙水压力的控制方程,设置好短
现代化强国无一不与教育密切相关,教育兴则民智启,重教育则续国力,教育是民族文明进步的基础,是国家兴旺的标杆。作为基础教育的义务教育备受社会各界关注,城乡义务教育均衡
随着视频监控的日益普及,海量的视频数据成为大数据应用的重要非结构性数据来源。自动地检测运动目标是大规模视频监控的重要研究课题,对后续的模式识别和行为分析有着重要意
氮化镓(GaN)作为重要的宽禁带半导体材料,具有高饱和电子迁移率、高热导率、耐高温和强辐射等特性,已经成为制备电力电子器件的理想材料。但是,由于难以获得高质量的单晶GaN
数据规约技术的目标是在不影响后续挖掘效果的前提下,缩减数据集合的规模,进而提高后续挖掘的性能,是知识发现过程中预处理数据的一个重要步骤。实例选取作为数据规约中的一