基于多类特征融合的蛋白质亚线粒体定位预测研究

来源 :内蒙古大学 | 被引量 : 9次 | 上传用户:pie1011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的顺利进行,数据库中出现了大量的未知功能的蛋白质序列,分析这些未知功能的蛋白质成为当今的首要任务。目前,亚细胞定位作为分析蛋白质功能的手段达到了一定水平,人们开始关注亚细胞器定位研究,由于实验分析耗时、成本高,因此利用计算的方法来预测蛋白质亚细胞器定位成为当前研究的热点。  本文系统的从蛋白质亚线粒体定位数据集的构建、特征参数的提取及优化、预测算法的建立以及算法的推广性等方面对蛋白质亚线粒体定位预测问题进行了研究,主要研究成果如下:  1、蛋白质亚线粒体定位研究的数据集建立时间较早,包含的序列较少,我们构建了一个最新的蛋白质亚线粒体定位数据集,扩大了序列数。采用ID-SVM算法进行预测,取得较好的预测结果,同时对Du建立的数据集进行预测,在Jackknife检验下的总体预测成功率达到94.95%,比AC算法和DWT算法的总体预测成功率提高了5.3%和1.6%。  2、在构建蛋白质化学位移数据集的基础上,通过分析蛋白质中20个氨基酸的二级结构与四种骨架原子的化学位移关系,发现每一种氨基酸的四种骨架原子的化学位移与二级结构有关联,呈现有规律的变化。通过化学位移的自相关算法来构建代表蛋白质的特征参数,应用在蛋白质亚线粒体定位中,达到目前最好预测结果。  3、提出氨基酸黏性(stickiness)特征参数,利用该特征参数结合化学位移等信息参数对Du建立的数据集进行预测,Jackknife检验下的总体预测结果为96.21%,比我们之前的研究结果提高了1.26%,定位于matrix的蛋白质全部预测正确,对outermembrane的蛋白质预测成功率有所改善,Sn达到85.37%,提高了4.87%。  4、建立了分歧杆菌蛋白质亚细胞定位数据集,并且用此数据集对我们提出的特征参数提取方式和预测算法进行推广性检测,得到较好的结果,Jackknife检验结果为94.00%,比Lin的方法高出2.8%,比Rashid的算法提高了11.3%,验证了我们算法有较强的推广性,可以应用到其他亚细胞定位问题上。  5、建立了化学位移参数算法acACS服务网站(http://wlxy.imu.edu.cn/college/biostation/fuwu/acACS/index.asp)和亚线粒体数据集网站(http://wlxy.imu.edu.cn/college/biostation/fuwu/mito/index.asp),为生物信息学和蛋白质亚线粒体定位预测研究提供服务。
其他文献