基于分层神经网络的蛋白质二级结构预测

被引量 : 2次 | 上传用户:litho
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质二级结构预测,是通过氨基酸序列,预测蛋白质二级结构的过程。氨基酸序列具有不同的长度,不同的氨基酸排列顺序。实验分析表明这种差异能够形成不同的蛋白质结构。研究蛋白质的结构意义重大,不但有助于了解蛋白质的作用,了解蛋白质如何行使其生物功能,认识蛋白质与蛋白质之间的相互作用,而且对生物学、医学和药学都有非常重要的作用。随着2003年人类基因组计划测序完成,更加大了未知结构的氨基酸序列与已知结构的氨基酸序列之间的数量差距,所以蛋白质结构预测迫在眉睫。本文所要研究的是如何构建一个蛋白质二级结构预测模型,使之能够更加准确的预测氨基酸对应的蛋白质二级结构。内容包括氨基酸序列的特征提取方式,神经网络结构设计及网络结构算法的选择。1.氨基酸序列特征提取。要对蛋白质结构进行预测,首先必须把氨基酸序列中的信息提取出来,即进行特征提取。选择何种提取方式非常关键,不同的特征提取出的信息大不相同,现在的方法主要从单种氨基酸,氨基酸序列,同源序列比对等不同角度对氨基酸特征进行提取。本文我们采用Psi-Blast方法,提取同源序列的氨基酸特征。实验表明,这种氨基酸特征预测正确率高,而且有扎实的理论依据。2.结构预测。结构预测实际上是根据提取出的有用信息,通过学习分析这些信息,总结出规律,实现对未知结构氨基酸序列的结构预测。对于这种信息维数高,计算量大的问题,借助神经网络是非常有效地。神经网络能够快速学习到序列中包含的特征,实现对结构的预测。而对于网络,选择何种优化算法是至关重要的,不同的算法会差生不同的时间效率,不同的算法对应不同的预测正确率。本文中我们将对各种不同的优化算法进行比较,选择出更适合的优化算法。预测过程中由于各种结构对应的数目差别较大,经常产生不均衡训练的问题,由此我们受计算智能优化算法中装袋原理的启发,我们采用有放回抽取样本的方式使各种结构对应的数目在训练过程中趋于平衡,很好的解决了训练不均衡的为题,而且提高了整个预测结构的正确率。预测过程中对于网络结构的设计也是比较重要的,一般算法采用两层神经网络预测方式,本文中我们尝试使用多层网络方式进行预测,并将多类问题设计成多个二分类问题的集成。通过试验表明,我们的结构设计模型能够更有效的提高预测的正确率。为了寻找一种更优的网络结构,本文首次将分层RBF神经网络(HRBF)应用在蛋白质结构预测中,HRBF不但能够实现对网络参数的优化,而且能够实现网络结构的优化。它不但解决了以前预测时只能提前固定网络结构和采用试探法选择隐层个数的问题,而且还能对高维特征进行选择性输入,实现了对原始输入的降维作用。
其他文献
介绍了淡水鱼鱼糜及其制品的种类,影响凝胶特性的因素、条件,加工工艺关键技术与机械,以及鱼糜及其制品腥味产生的原因和脱腥方法。
随着医学技术的发展,我们发现,在自然界中,病毒是威胁人类健康的主要病原体[1]。为了进一步探索中药在抗病毒方面的作用,笔者从中药的抗病毒机理和单味中药的抗病毒作用着手,
本文通过问卷调查 ,反映了大学英语的教学效果 ,分析了制约大学英语教学效果的原因 ,并在此基础上提出了相应对策。认为要扭转大学英语高投入、低产出的不良局面 ,必须实现教
鲜切果蔬是一种新型的安全、绿色、环保的果蔬产品,符合现代社会对健康食品的要求,有很大的发展前景。杀菌是保证鲜切果蔬品质安全的重要环节,目前应用最多还是含氯杀菌剂,但
目的介绍髌骨脱位的关节镜下微创手术技术及疗效。方法2004年1月至2007年6月应用关节镜技术对17例髌骨脱位患者进行了手术治疗,技术要点为关节镜下髌外侧支持带松解,内侧支持带
习近平有关人类命运共同体的重要论述对马克思共同体理论既有继承,又有发展,是马克思共同体理论发展的最新成果。探寻习近平人类命运共同体理念与马克思共同体理论之间的理论
采集脚印是三维地震勘探中的一种地震噪声,是三维地震观测系统的固有属性,从而影响了采集资料的振幅保真度。目前塔里木盆地台盆区勘探主要目的层为奥陶系缝洞型碳酸盐岩储层
职业自我概念是个人整体自我概念的一部分,它是职业生涯规划的基础,在个人职业生涯发展的过程中有着十分重要的作用。实验结果表明,团体辅导对大学生职业自我概念的发展有一
近年来,鱿鱼丝等水产干制品甲醛超标的报道越来越多,而甲醛是一种原生质毒,被国际癌症研究署定为A1类致癌物,因此鱿鱼丝的食用安全性引起了社会的广泛关注。实验中发现当鱿鱼