论文部分内容阅读
肝脏是人体中最大的实质性器官,主要负责着体内脂类、糖类、蛋白质、和维生素等众多物质的代谢,是人体中的代谢工厂。此外,肝脏在体内还发挥着解毒、免疫、存储糖原和维生素、合成胆汁以及造血等功能,被称之为体内最繁忙的器官。肝脏的复杂功能的发挥依赖于组成肝脏的各种类型的细胞,肝脏细胞主要分成两类:肝实质细胞(HC)和非实质细胞(NPC)。前者是肝脏中最主要的细胞类型,占据肝脏体积约80%,发挥着肝脏中的绝大部分功能。非实质细胞主要包括肝窦内皮细胞(LSEC)、枯否细胞(KC)、肝星状细胞(HSC)以及其他一些免疫细胞等。目前,对肝脏细胞的研究往往集中于某一种类型的细胞。本研究同时构建了多种类型细胞的基因表达谱,通过肝脏细胞水平表达谱的全面解析,系统地发现肝脏细胞中表达的新基因或新亚型,深入地了解肝脏不同类型细胞的共性与特性,全新地认识细胞在肝脏器官中的分工与协作。转录组和蛋白质组作为基因组后继补充研究对象,分别担当传递遗传信息和功能最终执行的角色。而蛋白质组鉴定覆盖度的范围往往是参照编码基因的数目,因此可寻求转录组水平的mRNA鉴定辅助蛋白质组的深度覆盖。除了覆盖度的优势以外,转录组水平在灵敏度和准确性方面具有无可比拟的优势,还可以更精确地鉴定到基因的可变剪接、RNA编辑等信息。目前,转录组测序(RNA-Seq)作为一项新一代测序技术,能在全基因组范围内以单碱基分辨率检测并定量转录片段,成为研究转录组表达谱的重要方法。首先,我们首次构建了肝脏细胞水平的转录组表达谱。以C57BL/6小鼠动物为模型,采用流式细胞术完成肝脏3种类型细胞(HC、LSEC和KC)的分选,确保各类细胞纯度和活性分别达到95%和85%以上。对细胞提取的RNA,利用新一代测序RNA-Seq技术,每种类型细胞得到3G以上的数据量,满足深度测序目的。通过数据低质量过滤、读段定位、转录本重构、表达定量以及质量控制等一系列的数据处理,完成了肝脏不同类型细胞转录组的定性和定量分析。在假发现率(FDR)5%的标准下,HC、LSEC和KC分别鉴定到了8802、10789和10125个基因,其中细胞特异表达基因分别是504、851和498个。基因表达丰度的相关性分析显示HC与肝脏组织之间的相关系数最高,两类非实质细胞之间相关次之。这体现了HC在肝脏细胞中占绝大部分比例的事实,是最能够代表肝脏组织的细胞类型。其次,基于肝脏细胞的转录组表达谱,我们完成了不同类型细胞系统的功能注释分析。其一,我们将各细胞表达基因根据丰度分成低、中和高表达组。通过功能富集分析,不同类型细胞存在共性:低表达组基因功能富集细胞粘附,基因集中于膜与细胞表面;中表达基因富集转录、转录调控以及RNA加工等,而高表达基因则在翻译、蛋白转运以及能量代谢方面。说明了细胞水平上参与同一生物学过程的基因其表达水平亦相似的普遍规律。其二,针对3种类型细胞显著高表达基因作GO功能富集分析,结果显示细胞显著高表达基因能够较好地表征各自细胞的生物学特性。例如,HC显著富集于氧化还原反应、各种代谢过程;KC作为肝脏中的巨噬细胞,富集条目则集中在免疫应答、损伤应答以及炎症反应等;而LSEC内血管发育、细胞分化调控与已报道的LSEC在肝再生中的重要作用相关。其三,细胞特异表达基因和共同表达基因在丰度分布和功能富集方面差异明显。细胞特异基因偏向于低丰度,位于细胞表面和膜位置,功能集中于小分子代谢以及细胞特殊的一些生物学功能。而共同表达基因富集于大分子代谢过程,集中在胞内亚细胞器分布。利用细胞特异表达基因进行通路富集分析,我们发现肝脏中很多生物学过程涉及不同类型细胞的协同作用。其四,各细胞内基因表达丰度的无监督聚类结果揭示不同类型细胞具有显著不同的基因表达模式,细胞富集表达的基因簇表明了各自的生物学特征。再次,我们系统地鉴定了肝脏不同类型细胞内的可变剪接以及细胞之间的可变剪接差异。HC、LSEC和KC即使都同属于肝脏,但来源属性均不同,HC属于上皮细胞,LSEC为内皮细胞,KC则是属于髓系细胞。以肝脏细胞为代表,我们第一次解析了细胞水平的剪接差异,对于揭示不同细胞为完成各自功能选择性表达不同剪接体具有重要意义。通过RNA-Seq数据重新拼接组装转录本,除了数据库已知转录本的鉴定,我们还发现了20%以上的新转录本,对应着不同的可变剪接方式。在3种类型细胞中,外显子跳跃均是最广泛的剪接形式。新转录本的鉴定及部分验证,丰富了对应基因的注释。另外,通过不同细胞之间的可变剪接事件比较,我们首次发现肝脏细胞之间存在着大量switching-like的剪接差异,不同细胞对于同一基因偏好表达不同的可变剪接体,以满足各细胞的功能需求。这一事实也得到了qPCR实验的证明。此外,我们尝试从剪接因子的角度解释了细胞之间剪接差异形成的可能原因。最后,我们以肝脏组织为例,采取转录组与蛋白质组数据的整合策略,鉴定新蛋白产物,优化了基因组注释。我们同时产出了肝脏组织的RNA-Seq数据和质谱数据。将转录组水平得到的可变剪接、RNA编辑和新编码基因信息扩充至已知蛋白质序列数据库,构建了肝脏组织特异的个性化蛋白质序列库。经过质谱数据检索,在FDR小于1%的水平下,我们共鉴定到150个新肽段,对应72个新可变剪接体、15个RNA编辑位点以及43个可能的新编码基因区。并且,随机选取了11个新肽段对应的转录本均得到了PCR和传统Sanger测序的证实。双组学水平上发现并验证的高可信新基因产物展示了我们方法的有效性。综上所述,我们首次构建了肝脏不同类型细胞的转录组表达谱,这是目前基于细胞水平的最大的小鼠肝脏转录组学数据,为研究肝脏细胞功能提供了一个全面的参考资源。通过对不同细胞转录组系统全面的功能富集分析,解析了肝脏不同类型细胞的主要功能,对细胞在肝脏器官中的分工与协作深化了认识,对于揭示器官中细胞的构成规律具有重要意义。此外,我们以肝脏细胞为代表,首次在特定实质性器官中揭示了不同细胞之间存在广泛的switching-like剪接现象,提示不同细胞会选择基因的不同可变剪接亚型以满足各细胞的功能需求。最后,转录组数据与蛋白质组数据的整合分析,鉴定并验证了高可信的新基因产物,为下一步肝脏不同类型细胞表达谱的全面鉴定打下了方法学基础。