必需基因理论预测的多种算法研究

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:datou17297
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究必需基因对于构建最小基因集、发现潜在的药物靶标和广谱抗菌药物的研发有着非常重要的作用。由于这些基因对于机体生存、繁殖和发育有着不可替代的作用,许多科研工作者不遗余力去探寻必需基因识别的方法。从传统的实验技术到结合计算基因组学的理论识别方法,必需基因的识别逐渐成为基因组学研究领域的一个热点。我们课题组曾经提出过3款用于必需基因预测的在线服务工具,比如基于同源必需基因和物种进化距离的Geptop,根据基因名称比较进行识别的CEG-Match,从DNA序列中提取序列组成特征去构建人类必需基因预测模型的pheg。在本课题必需基因理论识别研究中,首先从Geptop算法得到启发,将同源必需性的特征与支持向量机(SVM)算法结合起来,以机器学习打分的机制去代替物种进化距离给出的特征权重,自动地去学习每个特征对区分必需基因和非必需基因的重要性度量。对于物种内的必需基因预测,在选择的25个细菌中,通过此方法得到的10-折交叉验证的AUC值(受试者工作特征曲线下面积)最高达到0.9716。对于跨物种必需基因预测,我们则选择在10-折交叉验证中AUC值超过0.90且亲缘关系距离待测物种最近的那个物种为模型训练物种,然后用于待测物种的必需基因预测。通过将预测结果得分和待测物种原始已知的基因必需性进行比较,计算AUC值,最终得到最高0.9552的AUC得分和0.8314的AUC平均得分。在已有的必需基因理论识别算法研究中,这已经是非常不错的预测结果。病原菌必需基因预测有助于发现潜在的抗菌药物靶标,但有意义的抗菌药物不仅能作用于病原菌并抑制其生长,而且对于人体是没有毒副作用的。也就是说,这些药物不能与人类必需基因相互作用。因此,我们需要有效地识别人类必需基因,辅助抗菌药物的合理研发和利用,并有助于人类疾病的治疗。我们获取了人类癌症细胞系必需基因数据,从蛋白质-蛋白质互作网络、基因表达谱数据、GO功能注释三个角度去提取能表征必需基因和非必需基因区别的特征。结合支持向量机去构建预测模型,评估这三种特征对预测人类必需基因的贡献度,分别得到了0.8624,0.8272和0.8706的AUC得分。尽管在后两类特征中有不少的缺失值,但也都得到了不错的预测结果。此外,本文联合这三类特征构建了必需基因预测的集成模型,经过10-折交叉验证,最终得到的AUC值为0.9401,这是目前为止人类必需基因预测得到的最好的结果。本文主要围绕病原细菌和人类必需基因的理论识别问题展开,基于各自的研究现状,分别提取了不同的生物学特征去构建必需基因预测模型,并且都得到了不错的预测结果。但这些方法仍需要不断地研究和拓展,希望获得在必需基因识别领域上能真正得到广泛推广和应用的服务工具。
其他文献
图书馆在学校中是有着重要地位的,之前的图书馆管理工作也是井井有条,但是随着社会的不断发展,传统的图书馆管理模式已经不能发挥出很好的效果,因此新形势下该如何对学校图书馆进
5月26日,全国人大财经委《军民融合促进法》立法调研座谈会在江麓公司召开。中共中央委员,第二炮兵原政委、全国人大财经委副主任委员彭小枫,全国人大财经委委员马之庚、甘道明,
今年是“十三五”的开局之年,也是贵州发展的重要节点,是我们实现和全国同步小康的冲刺阶段。在广大的农村怎样才能脱贫?近日,记者以“构建农村电子商务体系,助推脱贫攻坚进程”
学位
<正>目的:观察营养治疗对2型糖尿病并高脂血症的作用。方法:观察2005年10月~2006年6月收住我院的2型糖尿病并高脂血症患者60例,严格控制饮食,观察饮食营养治疗前后的体重指数、
2007年7月,国防科技工业自主创新工作座谈会在陕西召开,会上,国防科工委进一步坚定始终坚持自主创新战略基点不动摇,同时强调要扎实工作,重点突破,把自主创新推向新阶段。西北工业
应用型本科教育的特征之一是不偏重于理论研究,强调教学的实践性、技术性、应用性。应用型本科院校的课程设置的主要依据是行业的就业热点,开设的 Illustrator 课程是高等院
<正> 欧洲债券市场是一个以欧洲为主体的全球资本市场,由初级市场和二级市场组成。伦敦和卢森堡是二级市场中心,其它重要市场还有法兰克福、苏黎世等。亚洲的新加坡和巴林也
近来有一条新闻炒得颇热,几乎各类文摘类报纸上都转载了。不妨摘引一处如下: “还”字两意引发官司1997年9月15日,济南市居民张某骑自行车行驶时被王某驾车撞伤。经交警部门
《红脸老师》是我的一篇周记,曾经发表过。我也曾品尝过创作之苦,但这篇文章确实是轻轻松松的一气呵成,因为我只是用每个人会写的句子忠实的记录了生活中值得赞美的三个片断
以浙江传统村落为例,基于生态审美语境下的认知,分析了聚落景观生成的审美背景,探讨了此在与共在、边界与领域、异质空间、原型同化与变异以及生活与空间耦合这些核心概念与