论文部分内容阅读
目的1.通过收集公共数据库中的病毒基因组序列及信息,分析MERS-CoV基因组在全球的分布特征。2.构建基于MERS-CoV全基因组的系统发育树,分析全球MERS-CoV S蛋白的氨基酸替换情况,并预测部分发生替换的S蛋白的结构。3.对MERS-CoV、2019-nCoV及SARS-CoV的基因组进行系统发育分析及S蛋白分析,为新型冠状病毒的研究提供新认识。方法1.获取MERS相关冠状病毒基因组的序列及信息(来源于NCBI,截止到2018年11月1日),如登记号、病毒分离国家、分离时间、宿主来源、样本类别、序列长度等信息,建立数据库。对基因组在时间、空间以及宿主方面的分布进行分析,采用曲线、地理图、表格等不同形式表示。2.使用MAFFT软件对相关冠状病毒基因组的全长序列进行比对,并用MEGA 7.0软件构建系统发育树,方法为邻接法,分支检验方法为bootstrap检验。采用BLAST对相关冠状病毒进行序列一致性比对。3.使用MAFFT软件对相关冠状病毒S蛋白的氨基酸序列分别进行比对。找出发生替换的位点并标记。使用SWISS modeling在线软件对所选S蛋白的结构进行预测。结果1.本研究收集468个MERS相关冠状病毒基因组信息,其中骆驼来源的占53.21%,人类来源的占44.44%,蝙蝠和刺猬来源,分别占1.92%和0.43%。病毒分离自全球20个国家,其中沙特阿拉伯所占比例最高,占47.01%;其次是阿拉伯联合酋长国,占36.75%。基因组分离数量在2015年达到了顶峰,之后迅速下降。在获得样本来源的324个MERS相关冠状病毒基因组中,鼻咽拭子的最多,占32.69%,其次为呼吸道分泌物,占14.32%。2.在基于468个MERS相关冠状病毒全基因组的进化树中,刺猬和蝙蝠分支在树中形成了一个原始分支组,骆驼来源与人类来源的基因组在进化树中呈现交叉分布。所有的骆驼-人类分支被进一步分为3大类,即Clade A,Clade B和Clade C。Clade A包括3个病毒基因组,分别为2个人类来源的EMC/2012(分离自沙特阿拉伯)和Jordan-N3/2012(分离自约旦)以及1个骆驼来源的D998/15(分离自阿拉伯联合酋长国)。Clade B包含绝大多数的骆驼-人类MERS-CoV簇。Clade C包含了所有17个分离自非洲骆驼的基因组,并且Clade C在Clade A和刺猬-蝙蝠分支组之间形成了一个独立的分支,距离蝙蝠分支非常接近。3.本研究在MERS-CoV的S蛋白上共获得了 54个发生氨基酸替换的位点,分别为NTD区域12个,RBD区域16个,HR1区域4个,其他区域22个。3个属于Clade A的S蛋白展示出比较少的氨基酸替换且RBD区域并没有替换事件发生,Clade B呈现出多且复杂的替换特征。相比于CladeA和Clade B,Clade C的氨基酸替换则比较集中,所有的17个S蛋白在26,194,1020,1158四个位点上基本均发生了氨基酸替换事件,且这四个位点的替换与CladeA在这四个位点发生的替换保持一致。不同类别的病毒S蛋白结构预测未发现明显差异。4.2019-nCoV与蝙蝠SARS类冠状病毒和SARS冠状病毒的序列一致性较高。MERS-CoV、2019-nCoV及SARA-CoV的全基因组系统发育树显示,2019-nCoV更接近于SARS相关冠状病毒基因组,且二者位于整个树的底端。MERS-CoV基因组与2019-nCoV基因组不直接相连。5.2019-nCoV的S蛋白比较保守,MERS-CoV的S蛋白氨基酸序列与2019-nCoV、SARS-CoV大部分不一致;2019-nCoV的S蛋白氨基酸序列与SARS-CoV较为一致。2019-nCoV的两个S蛋白和SARS-CoV的两个S蛋白结构预测显示,四个模型在整体上并没有显著的差异。结论1.针对MERS-CoV基因组在时间,空间,宿主及样本来源上的分布特征,可采取适当的预防和监测措施,减少疾病的发生。2.MERS-CoV基因组的非洲骆驼分支(Clade C)在系统发育和氨基酸替换上展示了其特殊性以及与Clade A的亲近性。MERS-CoV不同分支的S蛋白在结构预测上没有明显差异。应加强对非洲骆驼MERS-CoV的监测。3.2019-nCoV在序列相似度、系统发育、S蛋白氨基酸比对及结构预测等方面表现出与蝙蝠SARS类冠状病毒和SARS-CoV的亲近性。