论文部分内容阅读
高通量测序技术的发展促进了动物肠道微生物组的深入研究,但井喷式增长的微生物组学数据需要更加高效的分析方法,而机器学习算法对于微生物组学数据分析和建模有着其独特优势。青藏高原地区虽气候恶劣、人口稀少,但其特殊的环境也造就了此地区独特的生物多样性。因此,对青藏高原地区动物肠道微生物组进行探索,可以进一步推动青藏高原生物多样性研究与保护。本文对非侵入式无损伤采样得到的青藏高原大量动物粪便样本,基于16S rRNA高通量测序技术,运用聚类、降维、随机森林模型等机器学习方法,开展粪便微生物区系结构及多样性的数据挖掘,并提取差异显著的微生物标志物(特征菌属)。本文的研究内容如下:(1)针对哺乳动物粪便样本是否可以替代肠道内容物用于探索肠道微生物的问题,开展了数据分析和挖掘研究。采集了 6只体重、年龄相似的绵羊小肠(空肠)、大肠(盲肠和结肠)内容物及粪便样本进行16S rRNA测序。实验结果显示,尽管粪便的微生物区系不等同于大肠内容物的微生物区系,但由于其与大肠内容物的微生物区系相似度较高,非侵入式采集粪便样本可以用于表征动物大肠微生物区系。同时,通过对样本数据重新组合,确定随机森林模型更适合于挖掘组间菌群结构差异较大的样本。(2)利用16S rRNA测序技术,开展了从微生物角度解释发生腹泻的马粪便微生物群落结构组成和多样性的改变的数据挖掘研究,并筛选出了相关生物标记物。采集了青藏高原地区同一地点腹泻和健康的柴达木马粪便样本共16份,通过对这些样本菌群的分析发现,处于两种健康状态的柴达木马粪便微生物群落结构差异极大。同时,通过随机森林模型筛选出4个生物标记物,其中已经鉴定的甲烷短杆菌属(Methanobrevibacter)、纤杆菌属(Fibrobacter)、肉食杆菌属(Carnobacterium)和迷踪菌属(Elusimicrobium)极可能成为腹泻治疗或诊断靶点的潜在的生物标记物(特征菌属)。(3)开展了青藏高原地区自然放牧状态下双峰骆驼中人畜共患寄生虫与肠道微生物区系的结构、组成和多样性的关系的研究。采集了青藏高原地区自然放牧状态下的双峰骆驼粪便样本38份,进行了 16S rRNA测序及数据分析,并利用线性判别分析效应(LEfSe)来提取特征菌属。研究发现,3种寄生虫的感染并未对双峰骆驼的粪便微生物区系群落多样性造成显著影响,但对部分菌门、菌属的相对丰度影响极大。同时,筛选出与未感染3种寄生虫的样本间差异显著的特征菌属:瘤胃球菌属(Ruminococcus)和阿克曼氏菌属(Akkermansia)(只感染微孢子虫样本),颤螺旋菌属(Oscillospira)、普雷沃菌属(Prevotella)和阿克曼氏菌属(只感染十二指肠贾第虫样本),多尔氏菌属(Dorea)(同时感染隐孢子虫和微孢子虫样本)。(4)开展了青藏高原地区反刍动物肠道微生物群落结构特征的研究。采集了青藏高原上4个生态区自然放牧状态的牦牛、黄牛、犏牛和藏绵羊的340份粪便样本,进行16S rRNA测序数据分析及生物标记物提取。基于聚类、降维、斯皮尔曼分析和随机森林模型等分析发现,青藏高原地区反刍动物肠道微生物群被划分为两种肠型:瘤胃菌科UCG-005(Ruminococcaceae UCG-005)属肠型和不动杆菌属(Acinetobacter)肠型,有助于潜在疾病预测和食性分析。其中,不动杆菌属肠型是在青藏高原动物肠道微生物组研究及牦牛肠型研究中首次发现的。同时,确定了环境(饮食)是改变青藏高原地区反刍动物粪便微生物区系最主要的影响因素。此外,通过准确率较高的随机森林模型,在牦牛和藏绵羊中分别筛选并确定了最具影响力的2个生物标记物:赖氨酸杆菌属(Lysinibacillus)和瘤胃菌科UCG-002属(Ruminococcaceae UCG-002),不动杆菌属和克里斯滕森菌科R-7 group(Christensenellaceae R-7group)。综上,本文不仅确定了可以利用非侵入方法采样粪便样本用于研究肠道微生物组的可行性,并且根据样本微生物群落结构特点,使用LEfSe或随机森林或两者结合的方法,筛选出了可能成为高原动物腹泻、感染寄生虫的诊断、预防和治疗新靶点的潜在生物标记物(特征菌属)。此外,初步完成了青藏高原4个生态区的反刍动物的粪便微生物区系多样性研究和特征图谱。