论文部分内容阅读
肺炎克雷伯菌(Klebsiella pneumoniae)是院内感染最重要的多重耐药条件致病菌之一。11个不同来源的肺炎克雷伯菌基因组已被全测序,包括耐碳青霉烯类抗生素的、属于ST11型中国流行克隆株的临床菌株HS11286。近期发现的Ⅵ分泌系统(type Ⅵ secretion system,T6SS)是一种细胞接触依赖性的多组件跨膜通道,在细菌致病机制及细菌间拮抗作用中扮演着重要角色。T6SS已被发现存在于铜绿假单胞菌和霍乱弧菌等多个革兰阴性细菌中;但是在肺炎克雷伯菌中鲜有研究。本论文推测T6SS与肺炎克雷伯菌的致病性、耐药性、自然生存和传播性等关键生物学特性相关,利用生物信息学方法对已测序肺炎克雷伯菌基因组的T6SS基因簇和分泌效应物进行了系统地识别和比较,以辅助实验研究来解析T6SS的生物学功能。本文首先预测了肺炎克雷伯菌的T6SS基因簇。通过文献挖掘和生物信息学预测,本文识别了498个细菌菌株中的906个T6SS基因簇数据,主要包括:(i)经过对708篇PubMed收录文献的检索和人工校验,收集的57个菌株中64个T6SS、92个T6SE和25个免疫蛋白及127个调控因子;(ii)基于T6SS保守组件氨基酸序列的高度相似性预测的T6SS。SecReT6根据T6SS核心组件的序列相似性和基因排布,将这些T6SS系统地分为3种类型:i,ii和iii。利用PostgreSQL关系型数据库管理系统,本文建立了开放数据库SecReT6。SecReT6整合了多种异源数据,提供了基于Web的T6SS核心组件、T6SE和免疫蛋白、调控因子等功能和分类信息的浏览和查询服务。SecReT6还提供了相似性搜索、基因簇比对和系统发生学分析等在线工具。此外,基于不同类型T6SS核心组件的隐马尔科夫模型特征谱,开发了T6SS基因簇识别工具T6SS-HMMER。利用T6SS-HMMER工具,本文在11个已全测序的肺炎克雷伯菌基因组中识别了26个T6SS。其中,在肺炎克雷伯菌HS11286中识别2个T6SS基因簇:编码了12个T6SS核心组件的T6SS-1(KPHS22970..KPHS23190),及编码9个T6SS组件的T6SS-2(KPHS32450..KPHS32770)。其次,本文采用了三种方法来预测肺炎克雷伯菌T6SS分泌效应物(T6SE):(i)SecReT6收录了和已知T6SE高序列相似性的蛋白;(ii)通过T6SS基因簇比较分析发现,插入T6SS保守组件基因中的可变区可能携带了新的T6SE和相邻的免疫蛋白;(iii)基于已知T6SE的多重序列特征,提出一个基于支持向量机分类器的算法来预测零散分布在基因组的新T6SE。本文在肺炎克雷伯菌HS11286中识别了T6SS-1基因簇编码的效应蛋白KPHS23105和4个免疫蛋白KPHS23060-KPHS23090。最后,本文将T6SS保守基因簇的识别工作扩展到细菌III型和IV型等多组件分泌系统,以及原噬菌体、整合性接合元件、整合子、插入序列和基因组岛等可移动遗传元件的识别。这些分泌系统和可移动遗传元件常携带致病因子和获得性耐药基因,可视为病原细菌感染的风险基因。针对细菌基因组序列中这些致病和耐药相关风险基因的准确和快速识别需求,本文开发了基于高性能计算机群的在线预测服务STeP。STeP提供的VRprofile工具可在10分钟内完成肺炎克雷伯菌HS11286的5.3Mb染色体序列的分析任务;对预测出来的T3SS/T4SS/T6SS/T7SS和可移动遗传元件,VRprofile还提供了对后台数据库MobilomeDB收录已知元件的可视化比较分析服务。STeP服务器还提供了对完全或部分测序细菌基因组快速注释工具CDSeasy,细菌保守基因簇识别工具CGCfinder,COG基因集的可视化共定位工具COGviewer。总之,本论文以肺炎克雷伯菌为切入点,对已测序细菌基因组中T6SS及分泌效应物的分布进行了系统地考查。所构建的T6SS开放系统数据库和T6SE识别工具,有助于实验研究肺炎克雷伯菌及其他重要的革兰阴性病原细菌中T6SS与致病机制及细菌间拮抗作用之间的关系。细菌致病和耐药相关基因簇的生物信息学分析工具集将有助于从基因组序列水平快速预测病原细菌的潜在致病和耐药能力。