论文部分内容阅读
结核病是目前全球重点控制的传染病之一,严重威胁着人类的健康。其病原菌结核分枝杆菌具有强大的致病性和传染力,想要彻底了解和控制,对其毒力因子及致病机制的认识就显得非常重要。同时,目前基因组学的迅猛发展也为从整体上了解分枝杆菌菌株间的差异提供了有力的保障。
本文完成了结核分枝杆菌实验室标准弱毒株H37Ra(BIG)的全基因组测序和注释,并以此与强毒株H37Rv以及国家基因组南方中心完成的H37Ra菌株(HGC)进行比较基因组学的分析。H37Ra BIG含一条环状染色体,基因组全长4,421,537bp,GC含量65.61%;基因组中预测了4,592个ORF,平均长度866bp,编码基因序列总长与H37Rv以及H37Ra HGC相比略低,基因的平均长度也要明显低于它们。比较基因组学分析显示:强毒株与弱毒株的基因组序列高度相似,并且H37Ra HGC比H37Ra BIG更加接近H37Rv。强毒株与弱毒株之间整体线性顺序一致,未见明显的基因重排现象,1Kb以上的插入与缺失共有3个区域。H37Rv与两株弱毒株H37Ra基因组之间相同的SNP有138个,其中130个涉及到75个ORF序列;出现相同插入/缺失(indel)的ORF有22个。这些结果表明H37Rv与H37Ra菌株之间的多态性是非常有限,比其它分枝杆菌间相对较少。另外,值得注意的是,H37Ra BIG与H37Rv之间SNP以及indel的数量均明显多于H37Ra HGC与H37Rv之间,并且H37Ra BIG基因组中出现了126个被中断的编码序列(ICDS),其中的一些可能是潜在的毒力相关因子。
H37Rv与两株H37Ra之间三者核酸序列完全相同的ORF共有3484个,占H37Rv基因组已知ORF的87.30%,它们之间的差异大多数是由单核苷酸的多态和插入/缺失造成的。这些差异主要集中于PE/PPE蛋白家族、脂质代谢相关的基因、膜蛋白以及一些假设蛋白中,是H37Rv与H37Ra菌株间多态性的位点,可能对H37Ra失去毒力造成深远的影响,其中一些是首次发现的。