神经网络在蛋白质二级结构预测中的应用研究

来源 :南京航空航天大学 | 被引量 : 0次 | 上传用户:yao2042547
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着新发现的蛋白质一级结构数量不断增长,未知蛋白质二级结构的数量与已知蛋白质一级结构数量之间的差距不断被拉大,这就迫切需要利用自动化方法来预测蛋白质二级结构。利用人工神经网络从蛋白质一级结构预测蛋白质二级结构便是一种高效的自动化方法,但这种方法预测的结果并不理想。为了提高蛋白质二级结构自动化方法预测的精度,不仅需要理想的预测引擎,而且需要高效的蛋白质一级结构序列编码算法,从一级结构序列中提取更多与二级结构相关的生物进化信息。  论文首先叙述了蛋白质二级结构预测的研究现状和研究意义,并指出现有蛋白质氨基酸线性序列编码算法存在的问题。然后根据最大限度从蛋白质一级结构氨基酸序列中获取与蛋白质二级结构相关生物进化信息的思想,对现有的Profile氨基酸编码方式进行改进。最后在对Profile编码预测结果进行分析的基础上,设计了一种可以从一级氨基酸序列中获取更多二级结构生物进化信息的算法来提高二级结构预测的准确性,并依据改进算法进行了代码实现。  论文实验部分首先利用两种常用的蛋白质氨基酸线性序列编码算法(正交编码和Profile编码)结合具有解决非线性映射功能的BP神经网络对蛋白质二级结构进行预测,然后在原有的Profile编码算法基础上加入氨基酸之间的长程作用信息,提出改进的Profile编码算法,并利用BP神经网络作为预测引擎对改进后的编码算法进行验证,最终的实验结果表明改进后的Profile编码算法在预测准确率上要比常用的编码方式提高3%左右。
其他文献
随着虚拟化产品的不断普及和云计算技术的蓬勃发展,虚拟化集群被广泛的用于各行业领域中,用以支撑关键应用和服务;与此同时,人们对于集群高可用性要求也变的越来越高。虚拟化
Agent以其自治性、主动性和智能性等显著特性,为传统上我们难以有效处理的事务提供了一种新的解决方案,而本体采用规范化的描述语言,对领域知识进行描述,实现知识的共享与复
随着信息化与数字化的高速发展,世界上每天所产生的计算机数据除了数量上的快速增长,其组成结构也发生了巨大的变化,非结构化数据所占的比重越来越大,增长也越来越快,而传统
无线传感器网络(Wireless Sensor Network, WSN)是由大量廉价、体积微小的传感器节点以自组织的方式组成的无线网络。本文以拓扑控制技术为出发点,针对层次拓扑控制技术中的
中文分词是中文自然语言处理的基础性任务,分词的准确性直接影响到后续处理任务,分词的速度影响到后续的直接应用。成功的分词方法需要具有较高的准确性和快速切分的能力。由
网络管理在计算机网络的发展过程中所发挥的作用越来越重要。良好的、有效的网络管理可为用户提供高质量服务。SNMP协议作为事实上的工业标准,很好的解决了网络管理中遇到的网
近几年来,网络拥塞控制研究得到了飞速的发展,但是基于启发式的算法缺乏控制理论和有效的数学证明作基础,算法的参数配置也非常敏感,不同的参数配置结果也大相径庭。因此,这
广播加密提供一种在非安全信道上同时传输数字信息给多个授权用户的方法,广泛应用于付费电视、卫星广播通信、数字版权产品(如CD/DVD)的分发以及多媒体保护等领域。目前在广
基于深度相机的体感交互具有设备简单、对环境要求低等优势,成为近年来研究的热点。这一课题目前还存在着一些关键技术难题,如个体识别与跟踪、动作分析、交互命令设计等。本
学位