论文部分内容阅读
宏蛋白质组学是对特定时间点环境微生物整体蛋白质组成成份的大规模特征性描述。与宏基因组学相比,宏蛋白质组学可以系统地描绘微生物功能的动态变化。口腔是人类微生物组计划重点关注的五大人体部位(肠道、口腔、皮肤、鼻腔和泌尿生殖道)之一。口腔微生态的失衡不仅可诱发多种口腔疾病,还与肿瘤、糖尿病、类风湿性关节炎、心血管疾病、早产等全身疾病紧密相关,对人类健康影响重大。因此,利用宏蛋白质组学技术研究口腔微生物的组成和功能对于疾病的诊疗具有重要意义。
目前口腔宏蛋白质组学研究已取得了一定的研究成果,但在数据分析方面仍有待完善。人类口腔微生物数据库(Human Oral Microbiome Database, HOMD)是口腔宏蛋白质组研究中常用的数据库。但大量已被口腔宏基因组研究发现的微生物菌属未被收录其中。不完整的数据库可能会导致错误的宏蛋白质鉴定结果。另一方面,缺乏易于使用的宏蛋白质组学数据分析的工作流。因此,为获得更完整、准确的口腔宏蛋白质组研究结果,需首先构建口腔宏蛋白质组数据库,并对其数据分析方法和工作流进行优化,建立新的口腔宏蛋白质组学数据分析工作流。
牙周炎是常见的口腔疾病之一,能引起牙齿周围组织的炎症,严重时可导致牙龈从牙齿上脱落或牙齿松动、直接脱落。龈沟液是口腔体液之一,作为血清渗出物或炎性渗出物,可以反映宿主对微生物斑块攻击的响应幅度。因此龈沟液蛋白质组成的测定可为牙周和全身疾病的诊断提供信息。已有研究利用宏蛋白质组学方法,在唾液和牙菌斑中鉴定牙周炎导致的菌群变化,但目前尚无牙周炎龈沟液宏蛋白质组学的研究。
本研究的主要内容分为两部分。第一部分,口腔宏蛋白质组学数据分析工作流的建立,主要包括以下几点研究内容:(1)构建口腔宏蛋白质组数据库HOMPPD(Human Oral MetaProteome Plus Database);(2)建立基于HOMPPD的数据分析工作流;(3)利用建立的工作流对唾液蛋白质组的公共数据进行宏蛋白质组学重分析。第二部分,牙周炎龈沟液宏蛋白质组学研究,主要包括以下几点研究内容:(1)牙周炎患者和正常人群的人类和微生物蛋白质组构成比较分析;(2)牙周炎患者与正常人群差异蛋白质鉴定;(3)牙周炎患者的微生物菌群构成变化研究。本研究得到了如下主要研究结果:1.通过整合 HOMD 和两篇已发表的宏基因组研究结果构建了一个人类口腔宏蛋白质组数据库HOMPPD(Human Oral MetaProteome Plus Database),HOMPPD包括184个菌属、2793个菌种的蛋白序列,并免费提供数据库下载,下载地址为:ftp://111.198.139.72:4000//pub//metaproteomics//homppd.fasta。
2.建立一个基于HOMPPD的口腔宏蛋白质组学数据分析工作流,主要包括如下数据分析模块:利用“两步法”策略检索HOMPPD数据库、微生物类群鉴定和下游生物信息学分析。
3.利用公共唾液蛋白质谱数据集,对 HOMPPD 进行了初步测试,结果表明,利用HOMPPD能比HOMD 多鉴定出23.98%的新菌肽、39 个 HOMD中未收录的新菌属和124 个新菌种,证明了使用 HOMPPD 进行检索可以更加全面地鉴定唾液微生物的菌群组成。
4.利用构建的HOMPPD及其工作流对唾液宏蛋白质组进行了重分析,发现唾液微生物的菌属主要分布在FCB group 和4个门中(Proteobacteria、Fusobacteria、Firmicutes、Actinobacteria),且不同健康个体的唾液微生物组的菌属构成存在着较大的个体差异,同时也说明上述建立的工作流具有良好的实用性。
5.应用上述工作流对牙周炎龈沟液蛋白质组进行了分析,结果显示牙周炎组与正常组龈沟液中的细菌蛋白质均占所有蛋白质总鉴定数的1/3;同时发现了166个差异表达的人蛋白,其中50个在牙周炎组高表达,主要与免疫功能以及炎症的发生相关;67个差异表达的细菌蛋白,其中 31 个在牙周炎组高表达,主要与氨基酸、碳水化合物以及脂质转运与新陈代谢相关。
6.初步明确了牙周炎患者微生物菌属的构成,牙周炎患者的微生物菌属总丰度降低,但构成更加多样化;5个菌属在牙周炎组被特异性鉴定;构建了牙周炎组与正常组所有鉴定菌属的进化关系树,结果表明牙周炎组与正常组鉴定的菌属均主要分布在Fusobacteria、Proteobacteria、Actinobacteria、Firmicutes这四个门和FCB group中,而5个牙周炎组特异性鉴定的菌属都属于 Firmicutes。对两组共同鉴定菌属的主成分分析(PCA)结果显示,牙周炎组与正常组鉴定的菌属丰度分布具有显著差异。以上结果表明牙周炎患者的微生物组在定性和定量水平均发生了明显的变化。通过差异分析发现10个菌属在牙周炎组特异高表达。牙周炎和正常组的最优势菌属不同,分别为Treponema和Neisseria。
综上所述,本研究构建了一个基于HOMPPD的完整的宏蛋白质组学数据分析的工作流,可以完成从多肽鉴定到微生物类群构成和进化关系的数据分析。其中,HOMPPD数据库更全面地收集了口腔微生物的蛋白质序列信息,使用该数据库进行检索可以更全面的鉴定口腔微生物的构成。应用该工作流,本研究对牙周炎龈沟液蛋白质组进行了分析,发现了牙周炎患者龈沟液中人类和微生物蛋白质、以及微生物菌属构成的变化,为牙周炎的致病机制和生物标志物研究提供了重要信息。
目前口腔宏蛋白质组学研究已取得了一定的研究成果,但在数据分析方面仍有待完善。人类口腔微生物数据库(Human Oral Microbiome Database, HOMD)是口腔宏蛋白质组研究中常用的数据库。但大量已被口腔宏基因组研究发现的微生物菌属未被收录其中。不完整的数据库可能会导致错误的宏蛋白质鉴定结果。另一方面,缺乏易于使用的宏蛋白质组学数据分析的工作流。因此,为获得更完整、准确的口腔宏蛋白质组研究结果,需首先构建口腔宏蛋白质组数据库,并对其数据分析方法和工作流进行优化,建立新的口腔宏蛋白质组学数据分析工作流。
牙周炎是常见的口腔疾病之一,能引起牙齿周围组织的炎症,严重时可导致牙龈从牙齿上脱落或牙齿松动、直接脱落。龈沟液是口腔体液之一,作为血清渗出物或炎性渗出物,可以反映宿主对微生物斑块攻击的响应幅度。因此龈沟液蛋白质组成的测定可为牙周和全身疾病的诊断提供信息。已有研究利用宏蛋白质组学方法,在唾液和牙菌斑中鉴定牙周炎导致的菌群变化,但目前尚无牙周炎龈沟液宏蛋白质组学的研究。
本研究的主要内容分为两部分。第一部分,口腔宏蛋白质组学数据分析工作流的建立,主要包括以下几点研究内容:(1)构建口腔宏蛋白质组数据库HOMPPD(Human Oral MetaProteome Plus Database);(2)建立基于HOMPPD的数据分析工作流;(3)利用建立的工作流对唾液蛋白质组的公共数据进行宏蛋白质组学重分析。第二部分,牙周炎龈沟液宏蛋白质组学研究,主要包括以下几点研究内容:(1)牙周炎患者和正常人群的人类和微生物蛋白质组构成比较分析;(2)牙周炎患者与正常人群差异蛋白质鉴定;(3)牙周炎患者的微生物菌群构成变化研究。本研究得到了如下主要研究结果:1.通过整合 HOMD 和两篇已发表的宏基因组研究结果构建了一个人类口腔宏蛋白质组数据库HOMPPD(Human Oral MetaProteome Plus Database),HOMPPD包括184个菌属、2793个菌种的蛋白序列,并免费提供数据库下载,下载地址为:ftp://111.198.139.72:4000//pub//metaproteomics//homppd.fasta。
2.建立一个基于HOMPPD的口腔宏蛋白质组学数据分析工作流,主要包括如下数据分析模块:利用“两步法”策略检索HOMPPD数据库、微生物类群鉴定和下游生物信息学分析。
3.利用公共唾液蛋白质谱数据集,对 HOMPPD 进行了初步测试,结果表明,利用HOMPPD能比HOMD 多鉴定出23.98%的新菌肽、39 个 HOMD中未收录的新菌属和124 个新菌种,证明了使用 HOMPPD 进行检索可以更加全面地鉴定唾液微生物的菌群组成。
4.利用构建的HOMPPD及其工作流对唾液宏蛋白质组进行了重分析,发现唾液微生物的菌属主要分布在FCB group 和4个门中(Proteobacteria、Fusobacteria、Firmicutes、Actinobacteria),且不同健康个体的唾液微生物组的菌属构成存在着较大的个体差异,同时也说明上述建立的工作流具有良好的实用性。
5.应用上述工作流对牙周炎龈沟液蛋白质组进行了分析,结果显示牙周炎组与正常组龈沟液中的细菌蛋白质均占所有蛋白质总鉴定数的1/3;同时发现了166个差异表达的人蛋白,其中50个在牙周炎组高表达,主要与免疫功能以及炎症的发生相关;67个差异表达的细菌蛋白,其中 31 个在牙周炎组高表达,主要与氨基酸、碳水化合物以及脂质转运与新陈代谢相关。
6.初步明确了牙周炎患者微生物菌属的构成,牙周炎患者的微生物菌属总丰度降低,但构成更加多样化;5个菌属在牙周炎组被特异性鉴定;构建了牙周炎组与正常组所有鉴定菌属的进化关系树,结果表明牙周炎组与正常组鉴定的菌属均主要分布在Fusobacteria、Proteobacteria、Actinobacteria、Firmicutes这四个门和FCB group中,而5个牙周炎组特异性鉴定的菌属都属于 Firmicutes。对两组共同鉴定菌属的主成分分析(PCA)结果显示,牙周炎组与正常组鉴定的菌属丰度分布具有显著差异。以上结果表明牙周炎患者的微生物组在定性和定量水平均发生了明显的变化。通过差异分析发现10个菌属在牙周炎组特异高表达。牙周炎和正常组的最优势菌属不同,分别为Treponema和Neisseria。
综上所述,本研究构建了一个基于HOMPPD的完整的宏蛋白质组学数据分析的工作流,可以完成从多肽鉴定到微生物类群构成和进化关系的数据分析。其中,HOMPPD数据库更全面地收集了口腔微生物的蛋白质序列信息,使用该数据库进行检索可以更全面的鉴定口腔微生物的构成。应用该工作流,本研究对牙周炎龈沟液蛋白质组进行了分析,发现了牙周炎患者龈沟液中人类和微生物蛋白质、以及微生物菌属构成的变化,为牙周炎的致病机制和生物标志物研究提供了重要信息。