细菌必需基因的预测及进化特征的分析

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:luocheng890924
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
必需基因在细菌生存中扮演了一个相当重要的角色,其编码的蛋白质保证了细菌的正常生存和繁殖。在确定了致病菌的必需基因之后,我们可以将其当作治病药物的靶标,从而达到治疗疾病的效果;细菌必需基因的理论研究还有助于我们理解生命的起源和进化。所以,预测细菌的必需基因越来越成为生物信息学的研究重点。在预测细菌必需基因的方法中,实验的方法无疑是最准确的,但是实验周期长,操作麻烦,并且花费巨大,所以到目前为止只有很少的菌种的必需基因被确定出来,因此理论的方法越来越受到重视。本文就以细菌的必需基因为主要的研究对象,采用基于组成特征的理论方法来预测细菌的必需基因。我们首先根据注释文件从大肠杆菌的基因组序列中提取出其组成特征。然后用支持向量机(SVM)和主成分回归(PCR)的方法对组成变量进行分类处理,并用曲线下面积AUC的值来衡量分类器的效果。这也是第一次将主成分回归的方法用于细菌必需基因的预测。得出SVM的AUC为0.83,PCR结果为0.87。接着我们又对两种方法进行改进,在支持向量机方法之前,将组成变量进行特征分析(ttSVM),筛除必需基因和非必需基因没有明显差异的变量。对于主成分回归,加上了核函数(KPCR),提高了其对非线性特征的分类能力。改进后,ttSVM结果最高达0.87,KPCR则为0.84。接着我们将其他所有的已经实验确定必需基因的物种用该四种方法处理,AUC最高达到0.95。最后,我们用AUC大于0.8的物种,建立预测模型,构建了一个免费的网上服务IBEG(http://cefg.uestc.edu.cn/ibeg/),利用该服务,研究人员不但可以运用不同的方法预测未知基因的必需性,也可以对比不同方法的优劣。此外,我们还从功能性基因和水平转移基因两方面,分别对不同物种的必需基因、高密码子使用基因以及高表达基因进行了对比分析。在功能性基因中,必需基因所占的比例最多,说明必需基因中具有功能的基因比较多,功能越是对生命体重要的基因,进化越保守;在水平转移基因中,必需基因所占的比例也是最多,说明必需基因的功能中有一些管家基因,从而容易发生水平转移。综上所述,本文在组成特征上对细菌必需基因的预测做了新方法的处理,增加了新的组成特征,并对其在进化方面做了的研究。但是还有一些问题,需要进一步深入研究,并进一步完善。
其他文献
<正>近日,中船重工柴油机动力有限公司在陕柴重工召开验收会,会上陕西柴油机重工有限公司的"主要零部件工艺、总装工艺研究设计等"研制专题通过评审。该研制专题属于陕柴重工
0引言新疆近年来新能源装机与可调节电源的比例呈进一步扩大趋势,新能源消纳、调峰形式进一步严峻,2016年全疆电网调峰最大缺口192万kW,全年累计弃风电量38.4%,弃光电量31.8%,其中
本文主要探讨的是怎样营造轻松愉快的课堂氛围,激起学生对语文课的学习兴趣,以提高语文教学的工作效率。
我们知道,教学过程实际上是一种信息传递的过程,要成功地完成这个过程,就必须有一定的信息差。开展有效的含有"信息差"的教学活动,能引导学生进行真正意义上的语言交流,
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
【正】集体所有制商业服务业,是社会主义性质的集体经济,它的作用已越来越被人们所重视。积极恢复和发展国家计划指导下的个体商品服务业,是调整我国所有制结构的一项重要工
“箭文化”是江南的企业文化。以“敢为人先,敢干大事,敢挑重担”为主要内容的“亮箭”精神,正是江南广大员工进一步把创新理念融入到企业文化中去,致力于创建“创新型企业”的法
2013年1月12日某电厂5号机组零序电压保护动作,机组跳闸。1月14日发现4号机零序电压高,机组被迫停机检查,经检查发现两起事故均为高压厂用变高压侧垂直封闭盆式绝缘子内结冰,
本文简要介绍了数据挖掘的技术和应用 ,并用数据挖掘技术对英语中的汉语借词分类进行了分析和挖掘
【正】在我国的基本建设投资工作中,长期以来存在着“基本建设”与“挖革改”的概念、范围之争。有的同志认为,凡属扩大再生产的项目,应属于基本建设,凡属于简单再生产的项目