基于多类特征融合的蛋白质亚线粒体定位预测研究

来源 :内蒙古大学 | 被引量 : 9次 | 上传用户:pie1011
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人类基因组计划的顺利进行,数据库中出现了大量的未知功能的蛋白质序列,分析这些未知功能的蛋白质成为当今的首要任务。目前,亚细胞定位作为分析蛋白质功能的手段达到了一定水平,人们开始关注亚细胞器定位研究,由于实验分析耗时、成本高,因此利用计算的方法来预测蛋白质亚细胞器定位成为当前研究的热点。  本文系统的从蛋白质亚线粒体定位数据集的构建、特征参数的提取及优化、预测算法的建立以及算法的推广性等方面对蛋白质亚线粒体定位预测问题进行了研究,主要研究成果如下:  1、蛋白质亚线粒体定位研究的数据集建立时间较早,包含的序列较少,我们构建了一个最新的蛋白质亚线粒体定位数据集,扩大了序列数。采用ID-SVM算法进行预测,取得较好的预测结果,同时对Du建立的数据集进行预测,在Jackknife检验下的总体预测成功率达到94.95%,比AC算法和DWT算法的总体预测成功率提高了5.3%和1.6%。  2、在构建蛋白质化学位移数据集的基础上,通过分析蛋白质中20个氨基酸的二级结构与四种骨架原子的化学位移关系,发现每一种氨基酸的四种骨架原子的化学位移与二级结构有关联,呈现有规律的变化。通过化学位移的自相关算法来构建代表蛋白质的特征参数,应用在蛋白质亚线粒体定位中,达到目前最好预测结果。  3、提出氨基酸黏性(stickiness)特征参数,利用该特征参数结合化学位移等信息参数对Du建立的数据集进行预测,Jackknife检验下的总体预测结果为96.21%,比我们之前的研究结果提高了1.26%,定位于matrix的蛋白质全部预测正确,对outermembrane的蛋白质预测成功率有所改善,Sn达到85.37%,提高了4.87%。  4、建立了分歧杆菌蛋白质亚细胞定位数据集,并且用此数据集对我们提出的特征参数提取方式和预测算法进行推广性检测,得到较好的结果,Jackknife检验结果为94.00%,比Lin的方法高出2.8%,比Rashid的算法提高了11.3%,验证了我们算法有较强的推广性,可以应用到其他亚细胞定位问题上。  5、建立了化学位移参数算法acACS服务网站(http://wlxy.imu.edu.cn/college/biostation/fuwu/acACS/index.asp)和亚线粒体数据集网站(http://wlxy.imu.edu.cn/college/biostation/fuwu/mito/index.asp),为生物信息学和蛋白质亚线粒体定位预测研究提供服务。
其他文献
期刊
改革开放30多年来,我国的广播事业得到了飞速的发展,人们的娱乐休闲消费也越来越丰富。广播电视事业的主角播音主持人自然就成了人们最关注的对象,有影响力的播音主持成了许多人
英语是一门语言学科,口语是其教学中的重要组成部分,在新课改背景下,如何提高学生口语能力是亟待解决的问题.在传统教学中,受到应试制度的影响,大多数教师只专注基础知识,偏
期刊
钢琴音乐来源于西方,所以中国钢琴音乐要形成独特的民族特色也要借鉴西方技巧和艺术表达方式,将其融入到中国的民族音乐文化当中。中国钢琴音乐在不断的探索中已经找到自己的文
  通过几年多普勒大气雷达的使用情况,结合已山现的故障现象等问题,从故障现象、故障检测及故障排除三个方面,阐述了多普勒天气雷达使用过程中的软件系统故障,总结多普勒天气雷
非物质文化遗产的保护这些年来取得了巨大的成就,这个成就就像我们国家在经济上所取得的成就一样,本身就是一个奇迹.我曾经用十二个字概括我们的非遗保护:“起步晚,速度快,成
  对自动观测土壤水分站的数据进行质量控制的方法主要利用了要素允许值检查、台站气候极值检查、时间一致性检查、内部一致性检查。由于各层水分之间并不存在等式关系也不
本文拟根据以上这些史料,对中国打击乐器、打击乐的表演形式以及在乐队中的具体实践,作一概述,俾便大家对中国打击乐的发展有一概括的了解。
南黄海之滨,有着被誉为“中国海鲜之乡”、“南黄海旅游胜地”、“绿色能源之都”的江苏省如东县。网络平台上,有着“如东县实验中学博客”平台。在这样一个博客空间,有着两
  介绍了新一代多普勒天气雷达的系统组成资料格式及存储备份资料的重要意义,详细讲解了雷达资料预处理的shell脚本和实现雷达资料自动备份的DOS指令,并列出了为保证资料备份