基于生物信息学的弥漫型胃癌与肠型胃癌多组学多维度差异比较研究

来源 :中国医科大学 | 被引量 : 0次 | 上传用户:waly7208346
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景胃癌是中国第三、世界第四的致死癌症,是一个普遍性的健康问题。目前,病理学诊断依旧是胃癌诊断“金标准”。在临床中应用最广泛的病理分型主要有两种分类方式:一种是由Lauren提出的弥漫型胃癌(Diffuse gastric cancer,DGC)和肠型胃癌(Intestinal gastric cancer,IGC)的分类,另一种是由WHO提出的组织学分类。对于Lauren分型中的IGC,P.Correa提出了 IGC的分阶段演变过程,即慢性炎症、肠化生、异型增生、胃癌这一过程。虽然这对IGC的早期诊治起到了关键的作用,但只是在形态学上进行了详细分类,对于难发现且预后较差的DGC,目前仍然没有较好的癌前分期学说支持。肿瘤组织中肿瘤细胞自身可以发生多个层次的变化,如基因突变、DNA拷贝数变异、RNA转录差异、蛋白表达差异等。目前认为肿瘤的发生是由于多因素共同作用形成的。不同肿瘤其变化的形式也是不尽相同。关于DGC和IGC中肿瘤细胞的多重差异,我们还缺乏深入了解,有待深入研究。肿瘤微环境对肿瘤发生发展具有重要影响。在正常情况下,胃黏膜由上皮组织、间质组织及黏膜肌组成。其中间质组织主要由成纤维细胞和平滑肌细胞组成,也含有免疫炎性细胞,如淋巴细胞、浆细胞、巨噬细胞、嗜酸性粒细胞等。这些免疫细胞在细胞因子、趋化因子等诱导作用下被募集至胃黏膜固有层,在肿瘤免疫过程中发挥重要作用。深入了解DGC和IGC不同胃黏膜免疫微环境的变化状态能够揭示其在两类胃癌发生发展中的重要作用,从而可为DGC和IGC的预警预后及免疫治疗提供重要的理论参考依据。随着技术的进步,单细胞测序在肿瘤研究中日益发挥重要作用。拟时序分析通过对单细胞测序结果中的细胞表达进行降维排序,找到细胞发生发展过程中相似的细胞,进一步对这些相似的细胞进行分类,可以追踪细胞分化轨迹及发展规律。目前,关于胃癌组织发生的单细胞测序研究已有报道,但是聚焦DGC和IGC起源的研究尚未见报道。综上,本研究拟采用多种生物信息学分析手段,从肿瘤细胞自身特性,肿瘤微环境及肿瘤组织学发生等方面对DGC和IGC进行多组学多维度差异比较分析,旨在系统阐明DGC与IGC多组学差异化分子表型特征,为不同组织学类型胃癌精准诊治提供理论基础。研究目的1.通过对TCGA数据库中胃癌病例的多组学对比分析,明晰DGC和IGC在基因组、表观基因组、转录组、蛋白组等多种组学层面的差异。2.通过对TCGA数据库中胃癌病例的免疫细胞浸润程度及趋化因子、细胞因子表达程度的关联分析,明晰DGC和IGC在免疫微环境层面的差异。3.通过对公共数据库中单细胞测序结果的挖掘分析,明晰DGC和IGC细胞起源的差异,进一步阐明不同类型胃癌的组织发生过程。研究方法1.病例来源下载 TCGA(The Cancer Genome Atlas)数据库中胃癌(Stomach adenocarcinoma,STAD)的临床数据,在临床数据中提取有明确Lauren分型诊断的病例数据进行分析。通过筛选,在突变数据中DGC 65例,IGC 187例。在DNA拷贝数变异数据中DGC 64例,IGC 189例。在DNA甲基化数据中DGC 60例,IGC 162例。在mRNA数据中DGC 66例,IGC 181例。长链非编码RNA(Longnon-coding RNA,lncRNA)数据提取自 mRNA 数据,病例数同 mRNA数据中的病例数一致。在微小RNA(microRNA,miRNA)数据中DGC 66例,IGC 181例。在蛋白数据中DGC 60例,IGC 159例。单细胞测序数据使用 Sathe 等(https://dna-discovery.stanford.edu)及 Zhang 等(GSE134520)的Cell Ranger输出数据进行深度挖掘分析,病例包括:非萎缩性胃炎(Non-atrophic gastritis,NAG)3 例、慢性萎缩性胃炎(Chronic atrophic gastritis,CAG)3 例、肠上皮化生(Intestinal metaplasia,IM)6 例、早期胃癌(Early gastric cancer,EGC)1 例、进行期胃癌 4 例(Advancedgastric cancer,AGC),其中包括DGC 2例、IGC 2例。2.DGC与IGC多组学差异比较a)突变差异分析使用maftools包对DGC和IGC的突变数据进行比对和可视化。基于oncodriveCLUST算法鉴定癌症驱动基因。与癌症体细胞突变目录(Catalogue Of Somatic Mutations In Cancer,COSMIC)v2 突变特征差异进行比对,得到IGC和DGC突变特征差异。b)DNA拷贝数差异分析使用重要像差基因分析(Genomic Analysis of Important Aberrations,GAIA)方法对检测结果进行分析,通过对比正常基因得到IGC和DGC组织DNA拷贝数变异信息。c)DNA甲基化差异分析使用Illumina Human Methylation450K芯片测试结果对IGC与DGC的甲基化结果进行比对。d)ncRNA表达差异分析利用TCGAEnsembl数据库(v75)提取lncRNA信息,并进行下游分析。使用TCGAbiolinks包对lncRNA的原始计数(rawcount,RC)进行差异分析。由于miRNA数据量较少,采用TCGA数据结果,直接使用edgeR包进行差异分析。e)转录组学差异分析对TCGA下载的mRNA的RC数据进行使用TCGAbiolinks包标准化处理,然后使用edgeR包进行差异分析。f)蛋白表达差异分析对TCGA数据库中蛋白表达数据使用limma方法进行差异分析。g)功能富集分析使用clusterProfiler包进行GO、KEGG、GSEA功能富集分析。h)多组学联合及归因分析对于DGC和IGC的差异基因,使用GDCRNATools建立ceRNA网络,并使用cytospace进行可视化。对于在蛋白表达网络分析中的基因,使用starbase数据库对比其相应的miRNA,然后寻找miRNA对应的lncRNA,最后对比spearman相关分析结果确认其ceRNA 网络是否成立。根据蛋白所在通路及使用limma对蛋白表达数据进行比对后的结果,结合mRNA差异表达,建立蛋白—mRNA表达相关网络。使用多组学因素分析(Multi-Omics Factor Analysis,MOFA)进行多组学联合及归因分析。对因子进行解析并确认相关基因与相关功能。3.DGC与IGC免疫微环境差异分析a)免疫细胞浸润差异分析使用28种免疫细胞的元基因作为基因集对不同类型胃癌样本的mRNA基因进行单样本基因集富集分析(single-sample gene set enrichment analysis,ssGSEA),得到28种免疫细胞在DGC和IGC中的浸润程度。b)白介素、趋化因子及受体表达差异分析提取35种白介素、56种趋化因子及趋化因子受体表达量(logCPM),通过Mann-Whitney U test 比较DGC和IGC中各种细胞因子的表达差异。c)免疫细胞与趋化因子、细胞因子联合分析使用最小二乘回归方法对免疫浸润细胞、趋化因子、白介素进行交联分析。首先选择全部趋化因子作为自变量、每种免疫浸润细胞分别作为因变量,然后使用全部的免疫浸润细胞作为自变量,每种白介素分别作为因变量进行分析,建立趋化因子—免疫浸润细胞—白介素交互模型。4.基于单细胞测序的胃癌组织发生分析a)单细胞测序结果均一化处理、聚类分析及细胞鉴定。使用Seurat中的标准方法进行均一化,然后对细胞进行聚类,最后得到28种细胞。根据细胞所在病变类型以及标志基因进行细胞鉴定。b)拟时序分析使用Monocle3对Seurat均一化后的细胞进行聚类,然后对每个聚类中细胞进行排序,分析拟时序路径。我们对包含DGC细胞和IGC细胞两个亚群使用扩散映射(diffusion map)进行分析。c)转绿因子活性分析使用SCENIC对每种细胞的转录因子活性进行分析。d)不同胃黏膜状态中细胞间相互作用分析使用Cellchat对在不同胃黏膜状态中细胞之间的相互作用进行分析。根据数据库中的对于配体受体的标记以及各个配体受体在细胞中的表达情况,将每种胃黏膜状态下的细胞在相互作用过程中所扮演的功能角色分为:供体(Sender)、受体(Receiver)、中介体(Mediatior)、干预体(Influencer)四类。同时对这四类功能在各个细胞中的重要程度(Importance)进行评价。e)不同胃黏膜状态中胃黏膜上皮细胞通路分析对DGC细胞、IGC细胞、干细胞1(S1)、干细胞2(S2)、吸收细胞以及杯状细胞中预测活性大于0.7的转录因子,以及通过ChatCell计算后,在各个胃黏膜状态中以上述细胞作为受体且重要程度大于0.7的配体受体通路中受体基因合并后,使用KEGG数据库进行富集分析。研究结果第一部分弥漫型胃癌与肠型胃癌多组学差异比较1.DGC与IGC基因组学差异分析1.1突变差异分析1.1.1突变类型与特征差异DGC和IGC两种胃癌的点突变中最常见者皆为C-T转换突变;两者的片段突变类型也基本趋同,即,缺失(Del)最常见,其次为插入(Ins)。癌症体细胞突变目录(COSMIC)是对众多肿瘤突变基因总结归类,将肿瘤突变类型分为30种。通过和COSMIC的突变特征比对,我们发现DGC出现4种突变特征,分别为COSMIC特征1(Signture 1,余弦近似:0.953)、COSMIC特征17(Signture 17,余弦近似:0.976)、COSMIC 特征 6(Signture6,余弦近似:0.973)、COSMIC特征4(Signture 3,余弦近似:0.783);IGC出现3种突变特征分别为:COSMIC 特征 10(Signture 10,余弦近似:0.897)、COSMIC 特征 17(Signture 17,余弦近似:0.791)、COSMIC 特征 6(Signture 6,余弦近似:0.953)。1.1.2突变基因差异对比DGC和IGC突变数据,排在前10位的差异突变基因是:CDH1、FBN1、RELN、DNAH3、NEB、PCLO、FAT3、USH2A、MYO16、COL22A1。DGC和IGC突变率最高的前10位基因并不完全相同。DGC为:TTN、CDH1、CSMD3、TP53、MUC16、SPTA1、FAT4、ARID1A、CSMD1、PIK3CA,而 IGC 为:TTN、MUC16、TP53、LRP1B、FAT4、SYNE1、PCLO、HMCN1、FLG、ARID1A。其中两者相同的基因为:TTN、TP53、MUC16、FAT4、ARID1A。1.1.3突变联动性差异很多癌症中的基因在突变模式中表现出强烈的同现性或排他性。在DGC和IGC中突变的联动性均主要以同现关系为主,在DGC中突变基因发生联动性个数少于IGC。有少数突变之间出现排他性:在IGC中TP53基因同RELN、LRP2、PIK3CA、USH2A、KMT2D、OBSCN、ARID1A 及 MUC16 出现了排他性;在DGC 中 CDH1基因同DNAH5、LRP1B及CSMD3出现排他性。1.1.4驱动基因突变差异基于oncodriveCLUST算法鉴定癌症驱动基因,DGC中可能的驱动基因为SPECC1 和 PLOD3,IGC 中可能的驱动基因为 MYBL1、ZHF330、DAZAP1、DXX39B、SERPIN1 和 TVP23A。1.1.5通路节点基因突变差异TCGA工作组鉴定了 10条同癌症相关的通路,本文对各个通路进行了富集。其中TGF-β通路节点基因在IGC中突变率100%(7/7),在DGC中突变率同样是100%(7/7);DGC中突变率少于IGC。1.1.6突变基因富集分析使用GO与KEGG数据库对DGC和IGC突变差异基因进行功能富集,结果发现使用KEGG数据库富集未富集出相关功能。使用GO富集生物学过程(BP)前三位功能为:化学突触传递的调节、突触信号转导的调控、β-catenin/TCF复杂结合;GO富集分子功能(MF)前三位功能为:皮质细胞骨架、胞质区、电压门控钙通道复合物;GO富集细胞组分(CC)前三位功能为:钙离子跨膜转运蛋白活性、钙通道活性、电压门控钙通道活性。1.2 DNA拷贝数变异差异分析1.2.1 DNA拷贝数变异差异基因DGC中DNA拷贝数变异的基因共145个,其中扩增124个,缺失21个;IGC中DNA拷贝数变异的基因共7992个其中插入3908个,缺失4084个。DGC中前十位 DNA 拷贝数突变基因为:RN7SL5P(Del)、C12orf77(Amp)、LRMP(Amp)、CENPUP2(Amp)、C ASC1(Amp)ETFRF 1(Amp)、KRAS(Amp)、RNU4-67P(Amp)、LMNTD1(Amp)、TUBB4BP1(Amp)。IGC 中 DNA 拷贝数突变基因较多,FDR 值最小值相同基因超过10个,本文没有列出。1.2.2 DNA拷贝数差异基因富集分析对于DNA拷贝数变异基因进行功能富集。在DGC中,KEGG富集前三位通路为:黑色素瘤、胃癌、肌动蛋白细胞骨架调节。在IGC中,GO富集BP前三位为:对其他生物体防御、细菌防御、细胞杀伤;GO富集MF前三位为:丝氨酸型内肽酶抑制剂活性、味觉受体活性、苦味受体活性;KEGG富集到的前三位为:细胞因子与其受体的相互作用、卡波西氏肉瘤相关疱疹病毒感染及乙型肝炎。2.DGC与IGC表观基因组学差异分析2.1 DNA甲基化差异分析对DGC和IGC的DNA甲基化状态进行差异比较,一共有599个甲基化位点出现差异,这些位点位于411个基因及基因间区中。其中,在DGC中高甲基化位点462个,高甲基化基因328个;在IGC中高甲基化位点137个,高甲基化基因83个(详见正文表1)。2.2 DNA甲基化差异基因功能富集分析对DGC和IGC甲基化差异基因进行功能富集,结果发现使用KEGG数据库富集未富集出相关功能。使用GO富集BP前三位功能为:腺体发育、细胞-基质粘附的调节、蛋白质定位于膜的正调控;GO富集MF前三位功能为:肌动蛋白细胞骨架、电压门控钾通道复合物、钾通道复合物;GO富集CC前三位功能为:RNA聚合酶Ⅱ近端启动子序列-特异性DNA结合、近端启动子序列特异性DNA结合、DNA结合转录激活剂活性,RNA聚合酶Ⅱ特异性。2.3非编码RNA(ncRNA)表达差异分析对DGC和IGC的miRNA表达进行了差异比较,结果发现logFC绝对值大于2的基因共57个,在DGC中高表达4个,在IGC中高表达53个。对DGC和IGC的lncRNA表达进行了差异比较,结果发现logFC绝对值大于2的基因共24个,在DGC中高表达8个,在IGC中高表达16个(详见正文表2,3)。3.DGC与IGC转录组学差异分析3.1 mRNA表达差异分析对DGC和IGC进行了 mRNA表达差异比较,结果发现logFC绝对值大于2的差异基因共415个,其中在DGC中高表达基因共233个,在IGC中高表达基因共182个(详见正文表4)。3.2 mRNA表达差异基因富集分析对这些差异表达mRNA进行功能富集,GO富集BP前三位为:肌肉系统成长过程、细胞外结构构建、肌肉收缩;GO富集MF前三位功能为:受体调节活性、受体配体活性、硫化物结合;GO富集CC前三位为:细胞外基质、含胶原的细胞外基质、内质网腔;KEGG富集前三位为:磷脂酰肌醇3激酶信号通路、胰腺分泌、蛋白消化吸收。4.DGC与IGC蛋白组学差异分析对DGC和IGC的蛋白表达进行了差异比较,共87个蛋白表达出现差异,在DGC中高表达46个,在IGC中高表达41个(详见正文表5)。5.多组学参数联合分析与归因分析5.1 DNA甲基化和mRNA表达联合分析联合分析DGC和IGC的DNA甲基化差异和mRNA表达差异,结果发现8个甲基化位点同mRNA表达出现联动表现,其中在DGC中高甲基化低表达基因为MEIS1,在IGC中高甲基化低表达的基因为SGK2、APOH、TMED6、SERPINA10、HNF4A。5.2 ceRNA网络分析将本文分析发现的差异lncRNA、miRNA、mRNA与数据库中已知可结合的lncRNA、miRNA、mRNA 相比对,结果发现 lncRNAPVT1 可同 hsa-mir-106a、hsa-mir-106b、hsa-mir-17、hsa-mir-20a、hsa-mir-20b、hsa-mir-519d、hsa-mir-93 互相作用,而这些miRNAs又可同POLQ、PARD6B、HMGA2、CDC25A互相作用,提示上述lncRNA-miRNA-mRNA之间存在ceRNA调控网络。5.3 DGC与IGC相关通路差异表达蛋白多维调控网络分析对比DGC和IGC的蛋白表达结果,发现在DGC中,DNA损伤反应信号通路、上皮间质转化信号通路、激素A/B(Hormone A/B)信号通路、活化酪氨酸激酶信号通路、结节性硬化复合物-雷帕霉素靶蛋白信号通路中的蛋白表达更加活跃;而在IGC中,细胞周期信号通路中的蛋白表达更加活跃。通过多维调控网络分析发现DNA损伤反应通路在DGC中活跃是由于BRCA2、Chk1 在 DGC 中高表达,而在DGC 中 BRCA2 受 hsa-mir-369、hsa-mir-488、XIST、NEAT 1、HCG18 调控,CHEK1 受 hsa-mir-195、hsa-mir-497、P VT1、SNHG1、SNHG12、HCG18调控。上皮间质转化通路在DGC中活跃是由于Collagen Ⅳ、E-Cadherin在DGC中高表达,而在DGC中CDH1主要受突变影响,COL6A1受MEG3影响,关COL6A2 受 HSPA7、KCNQ1OT1、FBXL21、PCDHB18、TUG1、PCDHB9、RPLP0P2、ANKRD26P1、ZFP92、ZDHHC8P1、CIDECP、ZSCAN12P1、CASC2、H19、C4orf10、GATS.1、UBE2Q2P1、OR2A9P 影响,COL6A3 受 ACTN3、HSPA7、PCDHB18、TUG1、PCDHB9、ZNF702P、RPLP0P2、ZFP92、ZSC AN12P1、C ASC2、H19、GATS.1、FAM35B2、OR2A9P影响。激素A通路在DGC中活跃是由于ERalpha、PR在DGC中高表达,而ESR1受XIST、KCNQ1OT1、MEG3影响。激素B通路在DGC中活跃是由于AR、Bcl-2在DGC中高表达,而在DGC中BCL2受KCNQ1OT1、POLR2J4、NEAT1、HCG18、MIAT影响。活化酪氨酸激酶通路在DGC中活跃是由于EGFRpY1173和HER3pY1289在DGC中高表达,而在DGC中EGRF高表达,但未找出相关miRNA、lncRNA。结节性硬化复合物-雷帕霉素靶蛋白通路在DGC中活跃是由于4E-BP1pS65与RictorpT1135在DGC中表达量较高。在DGC和IGC中EIF4BP1 受 GAS5 影响,RPS6 受 hsa-let-7d、hsa-mir-1224、hsa-mir-125a、hsa-mir-212、hsa-mir-3187、hsa-mir-652、hsa-mir-744、SNHG1、SNHG12 影响。细胞周期通路在IGC 中活跃是由于 CDK1、CyclinB1、CyclinE1、CyclinE2、PCNA 在 IGC 中表达量较高,而在IGC中CDK1受SNHG3、DLEU1、TUG1影响。CCNE1受SNHG1、HCG18 影响,CCNE2 受 hsa-mir-30a 影响。5.4多组学参数归因分析对全部入组分析获得的63例DGC和175例IGC的多组学数据参数进行归因分析,包括突变基因10725个、DNA拷贝数变异基因3086个、甲基化位点373333个、miRNA基因799个、mRNA基因14202个、差异表达蛋白218种。通过分析得到各个参数与Lauren分型(DGC/IGC)的相关程度,其中相关程度最高者为DNA甲基化、相关程度最低者为基因突变。第二部分弥漫型胃癌与肠型胃癌免疫微环境的差异比较1.免疫浸润细胞差异比较DGC和IGC两组间免疫细胞浸润程度的异同。结果显示在IGC中浸润程度较高且有显著性统计学差异的免疫细胞包括:活性CD8 T细胞(Activated CD8 T cell)、CD56dim 自然杀伤细胞(CD56dim natural killer cell)、中央记忆 CD8 T 细胞(Central memory CD8 T cell)、效应记忆 CD8 T 细胞(Effector memory CD8 T cell)、幼稚树突细胞(Immature dendritic cell)、巨噬细胞(Macrophage)、骨髓来源的抑制性细胞(Myeloid-derived suppressor cells,MDSC)、自然杀伤 T 细胞(Natural killer T cell)、调节 T 细胞(Regulatory T cell)、Ⅱ型辅助 T 细胞(Type 2 T helper cell)。而在DGC中浸润程度较高且有显著性统计学差异的免疫细胞包括:活性B细胞(Activated B cell)、活性树突细胞(Activated dendritic cell)、γδ T 细胞(Gamma delta T cell)、幼稚 B 细胞(Immature B cell)、记忆 B 细胞(Memory B cell)、自然杀伤细胞(Natural killer cell)、髓样树突细胞(Plasmacytoid dendritic cell)、17 型辅助 T 细胞(Type 17 T helper cell)。2.趋化因子配体及受体基因差异对比DGC和IGC趋化因子及受体的表达差异,结果发现共28个趋化因子及受体出现了统计学差异。其中,在DGC中高表达的趋化因子及受体有:CCL2、CCL3、CCL18、CCL20、CCL21、CCL25、CCL26、CXCL2、CXCL4、CXCL7、CXCL11、CXCL13、XCL2、CCR3、CCR4、CCR5、CCR7、CCR8、CXCR3;在IGC 中高表达的趋化因子及受体有:CCL1、CCL8、CCL13、CXCL5、CXCL10、CX3CL1、XCL1、CCR1、CXCR2。3.白介素基因表达差异对比DGC和IGC细胞因子的表达差异,结果发现白介素中有20个出现表达差异,其中在DGC中高表达的白介素有:IL12B、IL13、IL17A、IL17F、IL22;在IGC 中高表达的白介素有:IL1B、IL4、IL5、IL7、IL16、IL17B、IL17D、IL18、IL21、IL24、IL26、IL27、IL32、IL33、IL34。4.免疫浸润细胞与趋化因子、细胞因子联合分析在IGC中,正向相关性较高的趋化因子与免疫浸润细胞有:CCL1、CCL5、CCL4、CXCL16与CD56dim自然杀伤细胞;CX3CL1、CCL8与嗜酸性粒细胞(Eosinophil);CXCL2与肥大细胞(Mast cell);CCL21与活性B细胞;CCL3与效应记忆CD4 T细胞(Effector memeory CD4 T cell);CX3CL1与自然杀伤T细胞。正向相关性较高的免疫浸润细胞与细胞因子有:17型辅助T细胞与IL23A、IL17A、IL13;自然杀伤T细胞与IL11、IL15;髓样树突细胞与IL13、IL17A;调节T细胞与IL11、IL15;γδ T细胞与IL6。在DGC中,正向相关性较高的趋化因子与免疫浸润细胞有:CCL4、CCL11与自然杀伤细胞;CCL14、CXCL9与髓样树突细胞;CCL11、CCL3、CCL5与嗜酸性粒细胞;CXCL10、CCL20、CXCL1与CD56dim自然杀伤细胞。正向相关性较高的免疫浸润细胞与细胞因子有:嗜酸性粒细胞、调节T细胞、自然杀伤细胞、幼稚B细胞与TXLNA;自然杀伤T细胞与IL10、IL26;自然杀伤细胞与IL17F;调节T细胞与IL10、IL15;γδ T细胞与IL32。第三部分基于单细胞测序的弥漫型胃癌与肠型胃癌组织发生学研究1.不同胃黏膜状态中胃黏膜上皮单细胞测序图谱对单细胞测序结果进行分析后,利用细胞特征基因共分离出29种细胞,其中上皮细胞15种,间质细胞14种(特征基因见正文表13)。在使用OLFM4作为干细胞特征基因对细胞进行标记时,我们发现有一部分细胞高表达OLFM4,但是在UMAP图中这部分细胞和其他干细胞位置较远,认为这部分细胞是一种干细胞的亚型,所以将这部分干细胞命名为干细胞2(Stemce112,S2),而将其余干细胞命名为干细胞 1(Stem cell1,S1)。对细胞进行分类后发现从NAG到EGC及AGC,细胞主要以胃小凹上皮细胞(Pit cell)、基底腺粘液细胞(Basal gland mucous cell,BGM)、干细胞1为主,同时干细胞的占比逐渐增多,在EGC中干细胞1占比最高。在DGC和IGC中,干细胞的占比降低,免疫相关细胞占比升高。2.胃黏膜上皮细胞的拟时序分析使用Monocle3对全部细胞进行聚类分析,然后进行拟时序分析。我们发现有两个聚类块分别包含DGC细胞(PartA)和IGC细胞(PartB)。据此虽然可以看出有分化轨迹,但是不易确认细胞所在状态的先后顺序,所以我们进一步使用扩散映射(diffusionmap)进行分析。结果发现PartA主要包含S2干细胞、杯状细胞、肠型内分泌细胞、D细胞、G细胞和DGC细胞。发现S2、杯状细胞的大部分以及DGC细胞三者出现细胞聚集的位置距离较近,而肠型内分泌细胞、D细胞两者出现细胞聚集的位置距离较近,G细胞集出现细胞聚集的位置与其他细胞距离较远。PartB主要包含主细胞、基底腺粘液细胞、S1干细胞、祖细胞(Progenitor cell)、胃小凹上皮细胞、吸收细胞(Entercoty)以及IGC细胞。这其中主细胞、BGM两者出现细胞聚集的位置距离较近,S1、祖细胞两者出现细胞聚集的位置距离较近、胃小凹上皮细胞、IGC细胞、吸收细胞三者出现细胞聚集的位置距离较近。通过分析发现,S2和杯状细胞及DGC细胞分化相近,S1和吸收细胞及IGC细胞分化相近。3.不同胃黏膜上皮细胞转录因子活性分析使用SCENIC方法对各种细胞的转录因子活性进行了鉴定,选取了预测活性大于0.7的转录因子作为在该细胞中发挥功能的转录因子。我们分析出S1、S2、吸收细胞、杯状细胞、DGC细胞、IGC细胞中具有活性的20个转录因子,其中有10个转录因子(GEBPD、ELF4、KLF5、MAFG、MAZ、PRDM1、SMARCA4、SREBF2、SRF、YY1、ZNF143)在不同胃黏膜上皮细胞中均有活性。在具有细胞特异性的活性转录因子中,我们关注到活性转录因子GATA6仅存在于S2、杯状细胞和DGC中;CEBPG存在于S1、吸收细胞、杯状细胞、IGC细胞中;KLF4存在于S1、吸收细胞、杯状细胞、DGC细胞、IGC细胞中;TBX3存在于S1、吸收细胞中;活性转录因子ELF3、HNF4A、MXD1仅存在于吸收细胞中;SUZ12存在于IGC细胞中;RB1存在于S1、S2、杯状细胞、DGC细胞、IGC细胞中;CD59存在于S1、S2、吸收细胞、杯状细胞中;CDX1存在于吸收细胞、杯状细胞、DGC中。4.不同胃黏膜状态中细胞间配体-受体相互作用分析进一步,我们使用Cellchat分析不同胃黏膜状态中细胞之间的相互作用,对每种细胞在相互作用过程中所发挥的功能进行评价。在DGC中,DGC细胞作为供体或受体(Sender或Receiver)且重要程度大于0.7的配体受体通路有:类胰岛素生长因子(IGF)信号通路、巨噬细胞迁移抑制因子(MIF)信号通路、中期因子(MK)信号通路、血小板衍生因子(PDGF)信号通路、多效生长因子(PTN)信号通路。在IGC中,IGC细胞作为供体或受体且重要程度大于0.7的配体受体通路有:分化簇抗原CD40信号通路、Fas受体配体(FASLG)信号通路、IGF信号通路、MIF信号通路、MK信号通路、PDFG信号通路、PTN信号通路、肿瘤坏死因子相关的凋亡诱导配体(TRAIL)信号通路。对比DGC及IGC中重要的配体受体通路,我们发现IGF信号通路、MIF信号通路、MK信号通路、PDGF信号通路、PTN信号通路在DGC和IGC中同样发挥重要作用。不同的是,在DGC中,MIF信号通路主要发挥作用者为MIF-(CD74+CXCR4),而在IGC中,主要发挥作用者为MIF-(CD74+CD44)。MK信号通路中,MDK-SDC4在DGC中的贡献要大于在IGC中的贡献。PDFG信号通路中PDGFA-PDGFRA在DGC中的贡献大于在IGC的贡献,而PDGFA-PDGFRB在IGC中的贡献大于在DGC中的贡献。在PTN信号通路中,PTN-SDC4在DGC中的贡献要大于在IGC中的贡献5.不同胃黏膜状态中胃黏膜上皮细胞通路分析利用KEGG数据库,我们对非萎缩性胃炎(NAG)、慢性萎缩性胃炎(CAG)、肠上皮化生(IM)、早期胃癌(EGC)、进行期胃癌(AGC)包括DGC和IGC等不同胃黏膜状态中胃黏膜上皮细胞通路进行了富集分析。在NAG及CAG状态下,没有呈现符合要求的结果。在IM状态中,S1富集到了磷脂酰肌醇3-激酶-蛋白质丝氨酸苏氨酸激酶信号通路、癌症蛋白聚糖通路、丝裂原活化蛋白激酶信号通路、人乳头瘤病毒感染、Rap1信号通路、粘着斑通路、肌动蛋白细胞骨调节通路、细胞外基质受体相互作用通路、乳腺癌通路、造血细胞谱系通路。吸收细胞富集到了利什曼病通路、肺结核通路、Rap1信号通路、肌动蛋白细胞骨调节通路、百日咳病毒通路、补体和凝血级联通路、造血细胞谱系通路、Th17细胞分化通路、吞噬体通路、JAK-STAT信号通路。值得提出的是,IM状态中可见DGC细胞存在(详见正文表14),功能富集结果显示DGC细胞富集到了人巨细胞病毒感染、病毒蛋白与细胞因子及受体作用通路、弓形虫病通路。在早期胃癌EGC状态中,干细胞富集到了细胞因子-细胞因子受体相互作用通路、MAPK信号通路、PI3K-Akt信号通路、肿瘤蛋白多糖、TGF-β信号通路、流体剪切应力与动脉粥样硬化、造血细胞谱系、调节干细胞多能性的信号通路、粘附连接、补体和凝血级联信号通路。在进行期胃癌中,干细胞1富集到了 PI3K-Akt信号通路、MAPK信号通路、粘着斑通路、肿瘤蛋白多糖、EGFR酪氨酸激酶拮抗剂(EGFR tyrosine kinase inhibitor resistance)通路、肝癌(Hepatocellularcarcinoma)通路、粘附连接通路、黑色素瘤(Melanoma)通路、ErbB信号通路、非小细胞肺癌通路。GCI富集到了肝癌通路、粘着斑通路、人乳头瘤病毒感染通路、黑色素瘤通路、胶质瘤通路、致心律失常性右室心肌病(Arrhythmogenic right ventricular cardiomyopathy)通路、细胞外基质受体相互作用、肥厚性心肌病(Hypertrophic cardiomyopathy)通路、小细胞肺癌(Small cell lung cancer)通路、扩张型心肌病(Dilated cardiomyopathy)通路。在进行期胃癌IGC状态中,S1富集到了磷脂酰肌醇3-激酶-蛋白质丝氨酸苏氨酸激酶信号通路、癌症蛋白聚糖通路、丝裂原活化蛋白激酶信号通路、粘着斑通路、EGFR酪氨酸激酶拮抗剂通路、肝癌通路、粘附链接通路、黑色素瘤通路、非小细胞肺癌通路、ErbB信号通路。IGC富集到了细胞外基质受体相互作用通路、细胞粘附分子通路、粘着斑通路、癌症蛋白聚糖通路、人乳头瘤病毒感染、致心律失常性右室心肌病通路、肥厚性心肌病通路、扩张型心肌病通路、致病性大肠杆菌感染通路、疟疾通路。在进行期胃癌DGC状态中,S1富集到了磷脂酰肌醇3-激酶-蛋白质丝氨酸苏氨酸激酶信号通路、癌症蛋白聚糖通路、丝裂原活化蛋白激酶信号通路、ErbB信号通路、粘着斑通路、EGFR酪氨酸激酶拮抗剂通路、乳腺癌通路、膀胱癌通路、前列腺癌通路、内分泌抗性通路。结论1.弥漫性胃癌与肠型胃癌在基因组学、表观基因组学、转录组学层面均存在差异,而在蛋白表达层面未见明显差异。弥漫型胃癌的基因、表观基因层面改变相对较少,转录层面改变相对明显。在弥漫型胃癌中DNA损伤反应、信号通路、上皮间质转化信号通路、激素A/B信号通路、活化酪氨酸激酶信号通路、结节性硬化复合物-雷帕霉素靶蛋白信号通路中的蛋白表达更加活跃;而在肠型胃癌中细胞周期信号通路中的蛋白表达更加活跃。多组学参数归因分析模型显示与Lauren分型相关程度最高的参数为DNA甲基化,相关程度最低参数为基因突变。2.弥漫性胃癌与肠型胃癌的免疫微环境可能由不同类型的免疫细胞主导,即弥漫性胃癌中以T细胞免疫浸润为主,而肠型胃癌中则以B细胞免疫浸润为主。本研究通过最小二乘回归方法建立了趋化因子-免疫细胞-细胞因子相关性模型。在DGC中,CCL4可以趋化自然杀伤细胞浸润癌组织,自然杀伤细胞在癌组织中释放IL-17F,进而刺激其他细胞因子产生。3.干细胞2、杯状细胞和弥漫性胃癌细胞基因表达模式相似,干细胞1、吸收细胞和肠型胃癌细胞基因表达模式相似,肠上皮化生不仅是肠型胃癌的癌前病变,也可能与弥漫性胃癌的发生密切相关。胃上皮细胞在各种不同疾病状态下有活性的转录因子以及重要的受体-配体通路具有明显差异,DGC细胞富集到的主要通路与病毒感染密切相关。
其他文献
目的:心血管疾病是影响老龄化社会健康问题的主要原因。衰老是心血管疾病发生的一个主要危险因素,在心血管疾病的发生和发展过程中长期存在。心脏衰老的典型特征是心肌细胞肥大、心肌间质纤维化、炎症细胞浸润和心肌持续性僵硬;这些改变是由心肌细胞以及心肌间质细胞基本功能变化引起的。研究老年心脏衰老及其发生机制,探讨在心脏衰老过程中的关键因子,可以为临床治疗提供新的靶点,具有十分重要的意义。异种共生就是利用年轻化
研究背景:原发性肝细胞肝癌(Hepatocellular Carcinoma,HCC)(下文以肝癌代称),从全球范围来看,其发病率和死亡率分别处在第五和第四位,是消化系统比较常见、后果较为严重的疾病之一。HCC发生的危险因素包括病毒感染、酒精过量、黄曲霉素及代谢相关脂肪性肝病等多种因素,过去的几年间,人们在肝癌诊断和治疗方面飞速进步,但并未有效的改善预后效果,所以揭示出HCC的发生和发展的具体机制
目的:肾透明细胞癌(RCC)是泌尿系统的第二大常见肿瘤,在世界范围内约占新发肿瘤总数的3%。超过90%的肾肿瘤为肾细胞癌,此类癌症起源于肾近曲小管上皮。在肾细胞癌的诸多亚型中,肾透明细胞癌(ccRCC)最为常见,约占总数的70%-80%,同时在病理上也是侵袭性最强的一种。蛋白酶功能的改变与肿瘤进展息息相关。蛋白酶作为ATP依赖性酶,有着半胱天冬蛋白酶样、胰蛋白酶样及糜蛋白酶样活性,能够对泛素化蛋白
前言:软骨肉瘤是一种比较常见的恶性骨肿瘤,约占全部原发恶性骨肿瘤的9.2%,发病率仅次于骨肉瘤,平均发病年龄在50岁左右,男性略多于女性(55%:45%)。软骨肉瘤包括多种亚型,其中传统型/经典型软骨肉瘤约占85%,其它亚型包括去分化型、透明细胞型、皮质旁型、黏液型、间叶型软骨肉瘤及恶性软骨母细胞瘤。传统型软骨肉瘤的5年生存率约为70%,广泛手术切除肿瘤是目前的主要治疗方法,因肿瘤基质丰富、血运匮
目的:随着RNA测序和生物信息学技术的发展,环状RNA已被证实在人类细胞中具有多种功能。许多研究报道了环状RNA在胃癌中的表达谱发现其在调控细胞功能方面具有潜在的价值,并在胃癌的发生和发展过程中发挥重要作用。Hsa_circ_001988作为环状RNA,已有文献报道其参与结肠癌、乳腺癌、非小细胞肺癌和肾透明细胞癌的调控。但hsa_circ_001988在胃癌中的作用尚无报道。此外,更多的证据表明环
目的:动脉粥样硬化(atherosclerosis,AS)是导致组织器官缺血的重要原因,是心脑血管及外周血管最常见的病理改变。动脉硬化闭塞症(atherosclerosis obliterans,ASO)是一种血管外科临床工作中常见的外周血管疾病(peripheral arterial disease,PAD),近年来发病率逐渐升高。下肢动脉出现粥样硬化后,随着病情进展,管腔逐渐缩小,导致组织缺血
目的:矿物粉尘诱导基因mdig作为一种新发现的肺癌相关基因,具有促进肿瘤细胞增殖的作用。脉管(血管与淋巴管)新生在肿瘤的发生发展过程中起关键作用。随着肿瘤细胞迅速增殖,瘤体内部形成局部低氧微环境,进一步刺激肿瘤的脉管生成。其中,VEGF家族是调控肿瘤脉管新生最为重要的蛋白之一。因此,本实验旨在探讨mdig能否调控VEGF家族的蛋白表达,进而影响非小细胞肺癌脉管的生成。研究方法:研究的第一部分:探讨
目的:甲状腺癌是当前临床中一种常见原发于内分泌系统的肿瘤。根据国际卫生组织公布的相关数据信息可知,近年来,世界范围内该肿瘤的发病率呈现逐年递增态势,且患病人群逐渐呈现低龄化特点。甲状腺癌在女性患癌群体中占比为5-10%。甲状腺乳头状癌(papillary thyroid cancer,PTC)是甲状腺癌的一种亚型,在甲状腺癌中该亚型的占比超过90%。临床研究显示甲状腺乳头状癌患者在接受正规治疗后预
研究背景:胃癌(Gastric Cancer,GC)是全球范围内第五大高发肿瘤疾病,居肿瘤死亡原因第二位。胃癌病因包括遗传因素、理化因素及感染因素等。在感染因素中,幽门螺杆菌与胃癌有关已达成研究者共识。除此之外,近年来EB病毒(epstein barr virus,EBV)也已引起研究者高度重视。EBV是1964年Epstein和Barr从非洲儿童Burkitt’s淋巴瘤培养细胞中发现的病毒,属人
目的:弥漫大B细胞淋巴瘤(Diffuse large B cell lymphoma,DLBCL)是最为常见的非霍奇金淋巴瘤,一线治疗R-CHOP方案(rituximab plus cyclophosphamide,doxorubicin,vincristine和prednisone)取得了较好的疗效,但仍约30%的患者出现复发或者耐药,随着研究的深入,复发难治的DLBCL较为常见的特征之一是淋巴