基于RBF神经网络的蛋白质二级结构预测问题的研究

来源 :四川师范大学 | 被引量 : 0次 | 上传用户:su9989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
生物信息学是一门交叉学科,是应用信息科学的理论、方法和技术来管理、分析和利用生物分子数据。通过收集、组织、管理生物分子数据,使研究人员获得或者方便地使用相关信息。生物信息学以计算机,网络为工具,采用数学和信息科学的理论、方法和技术去研究生物大分子,其研究重点主要落实在核酸和蛋白质两个方面,包括它们的序列、结构和功能。 蛋白质结构预测是生物信息学研究中的重要课题之一。而蛋白质二级结构预测是蛋白质结构预测中的重要组成部分,能为蛋白质的空间结构预测提供许多结构信息。在基于机器学习的二级结构预测方法中,神经网络的预测方法一直是一个研究热点,该方法提高了预测准确率,但是也存在着以下的问题:对当前位置的残基预测无法引入序列远距离信息。改进的预测方法是首先进行多序列比对找到待测蛋白质序列的同源信息作为输入信息,这样的改进是基于已知的家族蛋白质进行的。毫无疑问还有很多不属于任何家族的未知蛋白质,因此基于全局比对的神经网络方法也不能完全解决以上的问题。 本文从上面提到的问题入手,对经典的神经网络预测模型结构做了改进,建立了一个可以不用基于蛋白质同源家族进行信息提取的RBF神经网络预测模型,以期望提高预测的准确率。在对蛋白质序列用隐马尔可夫链模型(HMM)进行结构信息提取时,无需同源信息,也使模型预测时能引入了序列远距离信息,提高了对低同源和无同源蛋白质的预测可能性及预测精度。 本文还建立了一个生物信息学系统,并对预测结果和数据进行了预测评价,并提出了下一步的研究工作重点。
其他文献
随着高性能计算机的普及,利用计算机协助人工来处理日常的信息已经成为当前计算机科学发展的重要方向。模式识别作为主要的智能信息处理技术已经越来越广泛地被应用到日常生活
当今嵌入式微处理器和DSP的设计中,功耗已经成为至关重要的设计因素,其中片上Cache访问是嵌入式芯片功耗的一个主要来源。基于这一点,本课题希望建立一种可重构Cache的结构,能够
指纹识别是指通过计算机,利用人体固有的指纹生理特征来进行个人身份鉴别的技术。由于人体指纹具有唯一性和不变性,使得指纹识别与传统的认证方法相比,具有更高的安全性和易用性
手写字符识别是模式识别理论的一个重要应用领域,也是实现在各种背景下字符录入自动化的重要手段.特征提取和分类器设计是手写字符识别中的两个关键技术.虽然手写字符识别研
本文基于再生核理论对双臂自由飞行空间机器人(Dual-Arm Free-Flying Space Robot,简称DFFSR)运动控制的数值方法进行了研究。自由飞行空间机器人是当今空间机器人研究领域中的
数据挖掘是针对大量的数据进行分析,以得出有价值信息的过程。随着社会信息化程度越来越高,移动网络设备骤增,产生了大量的数据信息,如何从海量的数据中挖掘出有价值的知识,是数据
随着社会的进步和计算机技术的不断发展,现代智能设备的一个关键标识是人与机器之间的语音交互,语音识别和语音合成技术成为了人工智能研究的一个重要发展方向。语音识别技术
自上世纪90年代以来,包括中国在内的各空间大国相继提出以建立月球基地为主体的“重返月球”计划。月球环境具有高真空、微重力、高温差、强辐射等特点,因此月球探测是一项复杂
上世纪90年代中期以来,利用密码算法芯片的物理特性实施边界信道攻击引起了国内外密码学界的极大关注,已经成为密码分析学发展最为迅速的领域之一。实际应用的密码算法通常用专
本课题来源于船舶自动识别系统(Automatic Identification System,简称AIS),目的是构建一个基于嵌入式技术的船舶自动识别系统。嵌入式系统的处理器类型选用EP7312,操作系统采用