论文部分内容阅读
背景宫颈癌(cervical cancer)是目前世界上所有女性人口中第四大癌症发病类型,全世界每年有超过50万名女性被诊断为宫颈癌,且这种疾病已经导致了30多万病例的死亡,它已经成为了全球范围内的一种公共健康问题。在宫颈癌的发生发展过程中,伴随着一系列细胞谱系和突变基因的出现,然而在癌前病变和恶性病变的宫颈组织中,各种细胞类型及其分子特性的全谱仍没有明确定义,进而无法明确它们在宫颈癌发病机理中的作用。同时,目前针对宫颈癌的筛查主要依据人乳头瘤病毒DNA(human papillomavirus DNA,HPV-DNA)检测和液基细胞学检测(Thinprep cytologic test,TCT)的联合筛查,这种方法虽然可以近早发现宫颈病变降低宫颈癌的发病率和死亡率,但是也易漏检部分病人;阴道镜下活检并进行病理检查虽然可以确诊,但有创性检查也大大限制了阴道镜的临床应用。因此,筛选肿瘤相关基因对于宫颈癌的早期诊断以及发现其治疗靶点是十分必要的。先前基于临床组织样本的实验或应用数学模型探索宫颈癌分子特征的研究掩盖了不同细胞群体之间的差异。部分研究也只是依赖已知的膜标记物来筛选特定的细胞类型,无法完全区分组织中不同的细胞类型、检测出稀有细胞群体或发现具有特定状态的细胞,这就需要对恶性组织中不同的细胞群体进行全面系统的了解。为了更好地表征宫颈恶性肿瘤的细胞异质性就要通过单细胞转录组测序(Single-cell RNA-sequencing,sc RNA-seq)技术对单个细胞进行RNA分析,从而在肿瘤微环境中区分不同的细胞群体,捕获稀有细胞亚群的变化,从而提供了有关单细胞特性和异质性的更多信息。同时对宫颈癌进行sc RNA-seq分析获得的差异基因可能为其特异标志物的筛选以及精准治疗提供新的方向。本研究通过对来源于宫颈恶性肿瘤和癌旁的组织样本的群体细胞进行单细胞转录组测序,获得目标群体的单细胞转录组数据,实现对高通量单细胞数据进行细胞群体的分类以及细胞群体间基因表达的差异分析,探究宫颈恶性肿瘤微环境的异质性,并筛选出差异表达基因。方法采集新鲜的宫颈鳞状细胞癌组织和相应的宫颈癌旁组织样本制备单细胞悬液,将通过质检的上万个细胞应用10x Genomics和Illumina Nova Seq 6000平台进行sc RNA-seq。将获得的基因表达量进行PCA(主成分)线性降维分析,通过t SNE(非线性降维)将PCA结果在二维空间进行可视化,使用Seurat软件包进行Marker基因鉴定,使用Single R包进行sc RNA-seq的无偏细胞类型识别,独立地推断每个单细胞的起源细胞,得到细胞群体的分类并确定主要细胞簇。使用Seurat软件包进一步筛选出宫颈癌组织与癌旁组织间的差异表达基因。通过超几何分布检验进行差异显著基因的GO和KEGG富集分析。使用Monocle进行拟时序分析,描绘肿瘤细胞分化的动态轨迹。最后,依据纳入排除标准收集临床上2020年8月-2021年3月之间通过病理诊断为宫颈癌的患者,采集其癌症组织及癌旁组织,通过RT-q PCR实验对7个cluster特异性基因的转录水平进行验证。结果1.细胞类型鉴定:将从宫颈鳞状细胞癌组织获得的12,037个单细胞进行下游分析。通过t SNE降维聚类和已知的细胞类型marker,将细胞聚成了6个主要的cluster,包括:NK_T cells;Fibroblasts cells;Epithelial cells;Endothelial cells;B cells;Macrophage cells。2.差异表达基因筛选:与癌旁组织对比,在癌症样本中共筛选出117个差异基因,其中有29个上调和1个下调的差异显著表达基因。差异表达基因多表达于Fibroblasts cells和Epithelial cells。进一步通过对组间差异基因的筛选得到7个在每个cluster显著差异表达的基因:HSPA6、KRT19、TACSTD2、CLDN4、WFDC2、S100A2、SLPI。3.差异基因富集分析:GO分析表明差异基因的功能多集中于蛋白折叠(热激蛋白家族);趋化因子和细胞因子相关的信号通路;细胞对肿瘤坏死因子的反应;受体介导的细胞内吞作用等生物过程。KEGG分析表明差异表达基因多集中于免疫系统,与感染性疾病相关,以及信号转导过程相关的通路。4.宫颈恶性肿瘤的免疫微环境:由NK细胞、B细胞、T细胞、巨噬细胞、单核细胞组成,并包含多种亚型,同时KEGG pathway分析表明趋化因子CCL2、CCL3、CXCL1参与了免疫细胞的多条通路。5.拟时序分析:通过进一步对Epithelial cells簇的分析,共得到两个细胞亚簇,我们将其定义为type 1和type 2 Epithelial cells,宫颈癌上皮细胞趋向于由type 1向type 2分化进展,type 1高表达PIK3R3、CENPF等基因,type 2高表达KLK5、CEACAM1等基因。6.基因表达水平的验证:筛选得到每个cluster特有的7个基因通过RT-q PCR实验证实在宫颈癌症和癌旁组织中具有显著差异:HSPA6(p=0.0013)、KRT19(p=0.016)、TACSTD2(p=0.0182)、CLDN4(p<0.001)、WFDC2(p=0.0321)、S100A2(p=0.0027)、SLPI(p=0.0172)。结论1.本研究通过scRNA-seq描绘了宫颈鳞状细胞癌的肿瘤微环境的单细胞图谱,证明了宫颈恶性肿瘤的异质性,系统的分析了组成宫颈癌组织的6种细胞,肿瘤微环境中的5种免疫细胞及其亚型,并发现了宫颈癌症上皮细胞的2种不同亚型。2.Fibroblasts cells和Epithelial cells具有显著的组间差异,组间差异基因几乎均来自两种类型的细胞,证明成纤维细胞可能密切参与宫颈癌的进展。3.宫颈癌复杂的免疫微环境为研究宫颈癌的发生发展机制提供了基础,同时趋化因子CCL2、CCL3和CXCL1在调节免疫微环境中起到了重要作用。4.探索了两种类型的癌症上皮细胞分化的动态轨迹,肿瘤上皮细胞由type 1向type 2转化,type 2具有更明显的恶性表型。可以推测type 1高表达的CENPF基因可能通过激活PI3K/AKT通路促进细胞增值为早期癌症发生事件。Type 2高表达的KLK5、CEACAM1等基因可能为宫颈癌晚期治疗效果和预后的标靶。5.从单细胞水平探究了宫颈癌的差异表达基因,宫颈癌组织中7个cluster特有的显著差异基因(HSPA6、KRT19、TACSTD2、CLDN4、WFDC2、S100A2、SLPI)可能对宫颈癌的发生发展具有重要意义,有可能作为未来诊断和预后的标志物。