蛋白质超二级结构以及疟原虫线粒体蛋白预测的研究

来源 :内蒙古农业大学 | 被引量 : 1次 | 上传用户:lrq22
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
蛋白质的生物学功能与其空间结构密切相关,要了解和掌握蛋白质的功能首先是分析蛋白质的结构。如何预测蛋白质结构是生命科学中重大的研究课题之一,然而,通过实验手段确定蛋白质的结构,不但成本高、耗时,而且实验中还会碰到一些目前无法克服的技术困难,因此理论预测成为蛋白质空间结构获取的一个重要途径。从蛋白质一级结构直接预测三维空间结构非常困难,蛋白质超二级结构正是两者之间的重要桥梁,因此蛋白质超二级结构的预测有着重要的研究意义。  本文,首先我们选取序列同源性均低于30%的123个蛋白质,然后提取5类简单蛋白质超二级结构和β-发夹模体作为基准数据集,在两个基准数据集中分别提取6个原子化学位移作为特征参量,应用多种预测算法实施预测。其中在5类简单蛋白质超二级结构预测中,应用二次判别法取得结果最好,7折交叉检验获得的平均敏感性、平均特异性、总精度分别是81.8%、95.19%、82.91%;在β-发夹模体数据集中,3折交叉检验获得的敏感性、特异性、总精度以及马修斯相关系数分别是92%、94%、87%以及0.85。结果可见:化学位移作为特征参量和二次判别法结合可以有效的对蛋白质超二级结构进行预测。  疟疾是一种由疟原虫引起的严重危害人类健康的感染性疾病,疟原虫线粒体蛋白被视为有效的抗疟药物靶。近年来,随着生物信息学的飞速发展,越来越多的理论预测工作者投入到精确识别疟原虫线粒体蛋白的研究中。  本文,我们首次将蛋白质3种二级结构加入到疟原虫线粒体蛋白的预测工作中。我们选取序列一致性小于25%的pfM233数据集,通过提取蛋白质3种二级结构组份、20种氨基酸组份,400种二肽组份分别作为的特征参量,并使用方差分析对400种二肽组份进行特征筛选,然后应用支持向量机对pfM233数据集进行预测,最后我们发现:1)蛋白质二级结构的加入的确能够提高预测精度,此结果表明:对于疟原虫线粒体蛋白的预测,蛋白质二级结构组份的加入是一个有效的参数;2)特征参量的结合能够改善预测结果,但是在信息冗余的情况下,特征筛选能够降低维度,简化计算。当3类特征参量组合起来作为特征参量时,15折交叉检验获得敏感性、特异性、总精度以及马修斯相关系数分别是98.16%、97.64%、97.88%以及0.957,此结果与之前类似工作相比较,显示了我们工作的优越性。
其他文献
  通过资料收集,了解江淮分水岭红层严重缺水地区水文地质背景,归纳总结地下水类型及其富水性,地下水水量、水质分布特征,试图为该区域今后找水方向及供水方式提供建议及思路。
该论文的研究工作是结合着1999年8月开始的海河流域水资源规划工作进行的.规划工作的重要包括流域宏观经济水资源分析、流域水资源转化基本规律分析、水资源管理信息系统开发
摘要:众所周知,在烦恼与反感、紧张与压力下进行的学习,学习效果很差。相反,在愉快的心情下进行教学,学生注意力集中,思维敏捷,学习效率大大提高。因此,在课堂教学过程中,充分发挥教师和学生两方面的积极性,教师善教乐教,学生乐学,实行愉快教学,在轻松愉快的氛围中完成教学任务和要求,这是减轻学生负担。提高教学质量的好办法。那么,在课堂教学中如何实施愉快教学呢?本文就兴趣的诱发和情境的营造两方面谈谈笔者的做
  结合矿区水文地质特征,在分析矿区水文地质条件、地表水和地下水以及它们之间的水力联系情况的基础上,本文从岩层性质、地下水赋存及通道条件,确定了影响矿山充水的各因素,为
该论文提出了一种利用塑性极限分析下限法来分析重力坝抗滑稳定问题的技术.把重力坝坝体混凝土和地基岩石材料假定为理想刚塑性材料,应用结构塑性极限分析的有限元塑性极限分
该论文是在前人工作的基础上,通过分析资料,加上现场调查,针对徐州的用水现状和出现的环境地质问题而进行的地下水资源评价和管理.论文在系统分析研究区地质、水文地质条件的
  通过安徽省64个县的1∶10万县市地质灾害调查与划项目资料的整理分析,归纳总结了安徽省崩塌滑坡泥石流三种地质灾害与地层之间的关系,其主要发育在前震旦纪、二叠纪和第四
  本次研究基于对淮南矿区煤炭资源开采类型、矿山分布、开采方式的全面勘查,探讨了煤炭开采引发各类地质环境问题的起因,提出了煤炭资源化利用引发矿区地质环境破坏,进而对我
将水闸的底板和闸墩作为一个整体,建立了水闸整体有限元结构计算模型,计算结果是可信的.建立了将水闸的底板、闸墩、工作桥作为整体考虑的水闸整体有限元结构计算模型,将计算
学位