基于散列辞典的蛋白质二级结构预测方法

来源 :计算机技术与发展 | 被引量 : 0次 | 上传用户:ddeng
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
提出一种易于修改的蛋白质二级结构预测算法。以蛋白质数据银行中PDB文本数据作为数据源,提取所有蛋白质氨基酸序列并以此建立样本数据库,然后针对α-螺旋、β-折叠分别利用基于散列辞典的不同改进方法编程实现蛋白质二级结构序列片段预测,在预测过程中,随机抽取68421个蛋白质中部分样本作为测试集,对未知序列根据建立的散列辞典中的片段使用正向最大匹配分词法进行切分对比。从实验结果来看,对未知序列片段预测的准确度达到了83.9%,而且能够较好地体现片段之间的连接顺序。
其他文献
将高校基层党组织建设放到全面从严治党的背景下研究,具有重要的理论意义和实践价值。从加强高校基层党组织建设的价值判断着眼,对当前基层党组织建设中出现的组织设置凝固化
传统蛋白质二级结构预测,由于氨基酸序列中三种结构数量的差异,易造成不均衡训练,使得对三种结构的预测准确率差别较大。为改善这种缺陷,受装袋原理的启发,对传统方法进行改进,缩小
目的研究s EPCR、VEGF、MVD、KDR在早发型子痫前期胎盘中的表达情况。方法选取2016年3月至2017年4月我院收治的早发型子痫前期患者50例为研究对象,以同期入院体检的50例健康
学生课业负担过重问题,历来被人们关注却始终没有解决好,它危害极大、成因复杂。本文试图从心理学的角度分析家长给孩子“增负”的心理误区,以引起家长的重视。 一、盲目从众
【正】 一、中央与地方投资建设的范围、资金结构及建设方式 我国现行政府投资管理实行中央、省区市两级配置,两级管理。根据国务院1988年7月原则批准的《关于投资管理体制的
目的:本研究旨在探讨激酶插入区受体(KDR)基因遗传变异对贝伐珠单抗联合化疗治疗晚期非小细胞肺癌(NSCLC)患者疗效的影响。方法:本研究纳入135例一线接受贝伐珠单抗治疗的NSCLC患者
目的 :探讨氨甲环酸在腰椎退变性侧凸(DLS)患者截骨矫形长节段固定融合手术中的有效性及安全性。方法:本研究回顾性纳入101例行长节段(≥4节段)固定融合截骨矫形的DLS患者,术
散文是抗战时期郭沫若最为常用和最重要的文体之一,他的作品往往发表在主流媒体,表达着主流意识,构建着主流话语。他的散文写作显然拘囿于时代语境,创作激情让位于现实的情怀
提高医疗植入材料的生物相容性,对提升植入医疗器械的安全性有重要意义。通过超快激光制造出微纳米级别尺寸的材料结构以改善材料的生物相容性,近年来已被广泛应用于生物医学
施工建设项目资金投入失控、施工造价成本过高、资源浪费等现象是我国工程建设领域面临的重要问题。本文从工程造价管理的含义出发,着重分析了施工项目工程造价的确定方法和