酶蛋白质中β-发夹和βαβ特殊模体的预测

来源 :内蒙古工业大学 | 被引量 : 0次 | 上传用户:hongmusong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
酶是一类具有催化功能的蛋白质,它参与催化细胞生长、代谢等细胞新陈代谢中几乎所有的过程。因此,酶功能的研究是生命活动研究的重要课题。  酶蛋白质的功能与其结构密切相关,想了解酶蛋白质的功能,需要先测定其结构。由于实验测定酶蛋白质结构耗时且具有技术限制,理论预测酶蛋白质成为了研究的一大热点,大量已知的酶蛋白质氨基酸序列为其结构的预测提供了条件。但从酶蛋白质的序列直接预测其三级结构非常困难。超二级结构是三级结构的重要组成部分,是一级结构和三级结构之间的桥梁。β-发夹模体和βαβ模体是两类重要的超二级结构,它们包含大量的折叠信息和配体结合信息,因此,正确预测酶蛋白质中β-发夹模体和βαβ模体是一项有意义的工作。  本文对酶蛋白质中常见的特殊模体β-发夹和βαβ进行了预测。主要内容如下:  第一、酶蛋白质中β-发夹模体的预测  (1)依据ArchDB_EC数据库构建了非冗余的β-发夹数据集,包含序列相似性小于25%、分辨率高于3的酶蛋白质链1080条。通过统计分析,选取loop长为2-12个氨基酸的β-发夹模体作为研究对象,其中β-发夹模体2818个和非β-发夹模体1098个。  (2)采用矩阵打分算法对2818个β-发夹和1098个非β-发夹预测,预测效果不理想。为了提高预测精度,提出了基于矩阵打分值和平均化学位移值的支持向量机算法。以氨基酸位点亲疏水组分、位点亲疏水紧邻关联组分的打分值和平均化学位移值作为组合向量,输入支持向量机算法的预测总精度为81.8%,相关系数为0.636,预测效果好于矩阵打分算法的预测结果。  第二、酶蛋白质中βαβ模体的预测  (1)依据DSSP、PDB和SCOP数据库,构建了非冗余的βαβ模体数据集。得到了序列相似性小于25%,分辨率高于3,至少存在一个βαβ模体的酶蛋白质1141个,包含βαβ模体3081个,非βαβ模体2356个。  (2)通过统计分析,确定以loop-α-loop长10-26个氨基酸的βαβ模体为研究对象,包括βαβ模体2659个,非βαβ模体2002个。选取32个氨基酸为固定序列模式长,并对截取的固定序列模式做位点保守性分析。  (3)采用随机森林算法对酶蛋白质中βαβ模体进行预测,当以离散增量值、氨基酸残基间的相互作用、预测的二级结构信息和矩阵打分值作为组合向量时,5-fold检验预测总精度是84.7%,相关系数达到了0.686。将相同特征参数输入到支持向量机算法中,比较后发现随机森林算法得到的预测结果较好。
其他文献
近几年来,通信业务中的数据IP化业务呈现爆发性增长,所占比重越来越大,同时传统的语音业务也在保持平稳增长。业务接口也从传统的E1/STM-1等接口发展为FE、GE和光纤等高速接口。
随着嵌入式系统在各个领域的广泛应用,数据处理的要求越来越高,仅仅使用文件系统已经不能满足数据处理的需要。一种新型的数据库—嵌入式数据库逐渐出现在人们的视野。它克服
生物分子的高灵敏度检测在早期临床诊断,医药,基因工程等领域发挥着越来越重要的作用。发展一种快速、准确、高灵敏度、高选择性、高通量的分析检测生物分子的技术和方法一直
布拉格光纤光栅(FBG)传感器属于波长调制型光纤传感器,具有不受光源功率波动和系统损耗等独特的优点,成为目前光纤传感领域的研究热点之一。现在FBG传感器已广泛应用于航天工
人们通过图像认识和记录客观世界,在各种图像视频记录设备不断发展的同时,在不改变图像采集设备的条件下,如何通过软件技术来使分辨率较低的图像或视频变得更加清晰,已经成为了图
随着无线通信技术的发展,频谱资源也变得越来越紧张。为了提高频谱资源的利用率,维护控制通道的畅通,对无线电信号进行频谱监测就成为了必要。 本课题涉及的宽带数字化监测接
目前报道的大多数用于治疗人类疾病的药物都是小分子药物。其中,有些药物由于在体内具有多个靶标而具有多重功能,但同时也会带来一定的副作用。另外一些具有活性的天然产物,它们
本文主要针对分布于东南亚地区和我国西南地区及海南省花皮蛛科大花皮属蜘蛛进行了分类学研究。全文包括绪论、各论、结论与展望、图版、地理分布图五部分:  引言部分基于
氮是陆地生态系统中的一种主要限制因子。关于植物氮竞争策略的研究由来已久。不同的植物可能采用不同的策略来满足它们的氮需求。氮竞争策略的差异可能是物种共存的一种机制
目标跟踪技术作为当今计算机视觉领域的主要研究内容之一,已经广泛应用于社会的各个领域。但一套非常有效的实时目标跟踪系统仍然是众多专家学者们追求的目标,不过由于实际应用