基于词频统计编码和SVM的蛋白质二级结构预测方法

来源 :山东农业大学学报(自然科学版) | 被引量 : 0次 | 上传用户:edu009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在蛋白质二级结构预测中,常用的氨基酸序列编码方法产生的编码除了具有较高的维数外,也没有利用氨基酸序列片段中的统计信息。为此,提出了一种新的氨基酸序列编码方法--基于词频统计的编码方法,该方法统计每个氨基酸在氨基酸序列片段中出现的频率,利用该编码方法对氨基酸序列片段编码后得到一个20维的向量。与其它编码方法相比不但具有较低的维数,而且也充分利用了氨基酸片段内部所有氨基酸对目标氨基酸的影响。在实验中比较了四种编码方法结合支持向量机和BP神经网络的预测结果,实验结果表明,通过结合词频统计编码和支持向量机来预测蛋白质二级结构极大地提高了预测精度,远优于其它方法的预测结果。
其他文献
本文将对园林工程的特点以及质量管理的意义进行分析,并探讨如何加强园林绿化工程的质量控制。
空调系统作为现代办公、居住环境里必不可少的空气调节措施,其设计方案的科学性与合理性很大程度上影响着其发挥它使用价值的水平。笔者从事暖通专业设计以来,不断反思自己专业
近年来,小麦孢囊线虫病已成为我国小麦生产上的重要病害之一.掌握病原线虫的侵染动态是病害防控基础.本文在田间条件下,对两种孢囊线虫-禾谷孢囊线虫(Heterodera avenae)和菲
采用菌丝生长速率法,测定了采自泰安、平谷、杭州和昆明4个地区的42株辣椒疫霉病菌对氟吡菌胺的敏感性,结果表明,其EC50值在0.618~0.927μg·mL-1之间,平均EC50=(0.743±0.06
研究了现阶段高校学生消费的具体层次,分析了模型的总体框架,详细地阐述了模型的功能的功能,为高校学生管理者以及高校教师对日常的学生管理提供了一个较为准确的数据依据。本模
研究了计算机数学教学系统的实现目标、分析了系统的总体框架,设计了系统各个模块的功能,进行了集合与关系、图论、群与真值表的算法分析,画出了系统实现的流程图,利用计算机语言
随着网络的快速发展,网络上文本资源的搜索与使用已经成为了生活中不可缺少的一部分。本论文对垂直搜索引擎的发展及在发展中面临的问题进行了理论性的分析,介绍了垂直搜索系统
满意度理论广泛应用于优化、控制、管理、决策、资源分配、任务调度等领域,但大多是针对具体时间段定义和计算满意度,缺乏一种体现满意度在时间上变化的计算模型。笔者基于直觉
DIV+CSS是目前最流行的网页制作技术,但学习起来枯燥,不宜熟练掌握。为了提高教学质量,提升学习效果,进而使学生由浅入深、循序渐进地掌握这门技术,本论文通过教学方法的选用
农田水利建设管理的根本任务是保障农田水利建设的施工质量,确保建设优质的农田水利工程,但是目前的农田水利建设中仍然存在盲目性、随意性等问题。因而强化农田水利的建设管理