论文部分内容阅读
研究背景及目的:
肺癌是世界范围内发病率和死亡率最高的恶性肿瘤之一。据我国国家癌症中心报道,肺癌发病率占全国恶性肿瘤发病首位,每年新发病例人数已上升至80万例,在男性肿瘤发病中占第1位,在女性肿瘤发病中仅次于乳腺癌,占第2位。肺癌死亡率亦居全国恶性肿瘤相关死亡首位,每年死亡病例约70万例。其在男性、女性癌症相关死亡中均占第1位。发病机制涉及原癌基因活化、抑癌基因失活、诱导血管生成、生长抑制逃逸、调节能量代谢、自反馈分泌环活化、免疫逃逸、抑制细胞凋亡等多个步骤,由此导致肿瘤细胞生长的失控,最终致使细胞的增殖、分化、信号传递、运动、凋亡等生理功能失调。早期肺癌通过手术治疗可以达到较好的治疗效果,但大多数肺癌在诊断初期已经出现局部侵犯或远处转移,丧失手术时机,且癌症相关死亡大多是因为肺癌侵袭和远处转移引起。近年来,生物靶向治疗和免疫治疗有效的改善了晚期转移性肺癌患者的生存期和生活质量,但因受限于继发耐药,转移性肺癌患者总体预后不佳,2年生存率仍然很低。
随着基因芯片技术和高通量测序技术快速发展,生物信息学分析被广泛应用于肿瘤基因功能研究领域,为肿瘤科学研究提供了海量生物信息学资料,使得癌症的研究进入多维度综合性分析的高度。在生物学数据库中对癌症相关生物学信息进行整合分析成为研究癌基因的有效手段,其中以GEO数据库为目前最大、最全面的存储基因芯片和高通量测序表达谱的公共数据库。国际癌症基因组图谱(The Cancer Genome Atlas, TCGA)数据库收录了多个癌症基因组学数据,包括表观遗传组数据、转录组数据、基因突变数据、蛋白组数据以及各癌症的临床数据,为肿瘤的发生发展相关机制研究及关键基因挖掘筛选提供了丰富的资源。公开的数据库资源为癌症研究人员提供了大量关于癌症基因学和表观遗传学数据,合理有效整合这些公开数据,可快捷发现癌症生物标记物和治疗靶点,为癌症的诊断、个体化精准治疗和预防提供依据。
本研究基于GEO数据库,筛选出肺腺癌转移相关的基因芯片样本集,通过R语言分析分别得到关于肺腺癌高转移性的差异表达基因集,对差异表达基因分别进行GO功能富集分析及Pathway分析,对样本集的差异表达基因分析得出共表达差异基因,在GEPIA数据平台进行生存分析,利用Oncomine、Kaplan-MeierPlotter等在线分析平台通过TCGA等数据库中肺腺癌的相关临床信息对共表达基因进行验证,最终选取肺腺癌细胞和癌旁组织中差异表达且与患者总生存时间密切相关的基因SLC44A1为肺腺癌转移关键基因。我们首先在配对的肺腺癌组织和癌旁组织中分析其与临床病理特征的相关性。用免疫组化方法验证肺腺癌组织中SLC44A1蛋白的表达并分析其与患者预后的相关性。随后我们在体内、体外实验中研究了SLC44A1对肺腺癌细胞Calu3、H322增殖、侵袭、迁移、细胞凋亡、自我更新能力、移植成瘤等生物行为的影响,最后从免疫浸润方面对SLC44A1影响肺腺癌转移的机制进行了初步探讨。
第一部分肺腺癌转移相关基因的生物信息学分析和筛选
方法
1、在GEODataSets中以“lungadenocarcinoma”、“metastasis”为关键词进行检索,筛选符合肺腺癌转移的样本集。
2、分别下载保存样本集CEL数据文件和对应的平台探针文件。使用R软件对芯片软件进行预处理。
3、以转移组为实验组,以非转移组为对照组。利用R软件中的limma包对两个样本集分析差异表达基因,以|logFC|>1且adj.p<0.05为纳入标准,筛选显著差异基因。
4、对样本集的差异基因进行共表达分析,获取肺腺癌转移相关的关键基因。
5、在GEPIA在线平台对显著差异基因进行预后验证,选取与肺腺癌预后高度相关的基因作为关键基因。
结果
1、筛选到符合肺腺癌转移相关的2个基因芯片原始数据样本集GSE76194和GSE42407,上述2个样本集的基因芯片平台文件均为GPL570。
2、样本集GSE76194肺腺癌部分包含8个样本,样本集GSE42407中包含6个样本,预处理后矩阵数据标准化效果良好,可进行后续分析。
3、获取差异表达基因后,以|logFC|>1且adj.p<0.05为纳入标准筛选显著差异基因,GSE76194中共199个显著差异基因,107个上调基因和92个下调基因。GSE42407中共3278个显著差异基因,2601个上调基因和677个下调基因。
4、对2组差异基因进行共表达分析发现,2个样本集中共表达基因共22个,其中上调基因18个,下调基因4个.
5、对共表达基因进行GO功能富集分析及Pathway分析结果显示其生物功能富集癌症相关通路。
6、通过GEPIA在线平台验证,SLC44A1与患者预后显著相关,高表达组患者生存率明显低于低表达组。
小结
1、分析肺腺癌转移相关基因芯片GSE76194和GSE76194的差异表达基因,对2个样本集差异基因进行共表达分析后筛选出18个上调基因和4个下调基因。
2、通过在线生存验证,推测SLC44A1在肺腺癌发生、侵袭、转移中发挥着重要作用。
第二部分SLC44A1在肺腺癌中的表达及临床意义
方法
1、在Oncomine和TIMER数据库中进行SLC44A1在不同癌症中的表达水平分析。
2、下载TCGA中肺腺癌RNA-seq数据,分析肺腺癌临床样本中SLC44A1的表达情况。匹配临床信息数据,分析肺腺癌临床样本中SLC44A1的生存相关性。
3、采用RealTime-PCR检测肺腺癌组织和癌旁组织中SLC44A1mRNA的表达水平,分析其与临床病理参数的相关性。
4、应用免疫组化方法检测SLC44A1蛋白在肺腺癌组织和癌旁正常组织中的表达,分析其与临床病理参数的相关性。
5、分析SLC44A1的表达水平与患者生存预后的相关性。
结果
1、Oncomine和TIMER数据库结果均显示SLC44A1在乳腺癌、宫颈癌、头颈部癌、肺癌、淋巴瘤、胰腺癌等中高表达;在膀胱癌、乳腺癌、结直肠癌、肾癌、肝癌中低表达。
2、TCGA数据库中发现SLC44A1在肺腺癌组织中表达高于正常组织,转移肺腺癌(M1)中表达高于非转移肺腺癌(M0),差异均有统计学意义。
3、68例配对的肺腺癌组织中SLC44A1mRNA的表达显著高于癌旁正常组织(p<0.05),且其在癌组织中的表达水平与淋巴结转移、肿瘤分期和生存状态显著相关(p<0.05)。
4、肺腺癌组织中SLC44A1蛋白表达水平显著高于癌旁正常组织(p<0.05),且其在癌组织中的表达与淋巴结转移、肿瘤分期和生存状态显著相关(p<0.05)。
5、SLC44A1的表达与患者生存相关,高表达患者预后更差。
小结
1、SLC44A1在包括肺腺癌在内的多种癌症中呈高表达。
2、SLC44A1在肺腺癌组织中表达高于癌旁正常组织,转移组患者表达更高,且与患者原发肿瘤范围、淋巴结转移、肿瘤分期相关。高表达患者预后更差。提示SLC44A1可能参与肺腺癌恶性进程。
第三部分SLC44A1对肺腺癌细胞生物行为的影响
方法
1、应用RealTime-PCR检测SLC44A1mRNA在三株人肺腺癌细胞系及人正常肺支气管上皮细胞系中的表达。
2、构建SLC44A1稳定敲低的肺腺癌细胞系,用WesternBlot和Realtime-PCR方法验证SLC44A1的敲低效率。
3、平板克隆实验和细胞增殖实验(CCK8)检测肺腺癌SLC44A1敲低对细胞增殖能力的影响。
4、应用划痕和Transwell实验检测SLC44A1敲低对肺腺癌细胞侵袭迁移能力的影响。
5、超低粘附成球培养实验检测SLC44A1敲低对肺腺癌自我更新能力的影响。
6、构建裸鼠肺腺癌移植瘤模型,观察瘤体生长,检测肿瘤部位SLC44A1及增殖侵袭相关指标的表达。
结果
1、SLC44A1在肺腺癌细胞株A549、Calu-3、H322中表达明显高于人肺支气管上皮细胞系BEAS-2B。
2、选择SLC44A1表达相对较高的肺腺癌细胞株Calu-3、H322构建其稳定敲低的细胞系。
3、敲低SLC44A1基因能抑制Calu-3、H322的增殖、侵袭、迁移,但对肺腺癌细胞自我更新能力无明显影响。
4、在裸鼠成瘤实验中,敲低SLC44A1基因能抑制裸鼠成瘤能力,其肿瘤部位SLC44A1和增殖侵袭相关指标ki-67和MMP9表达均下调。
小结
1、体外实验显示用shRNA稳定敲低SLC44A1的表达水平可以显著降低肺腺癌细胞的增殖和迁移侵袭能力、但不影响肺腺癌细胞的成球的能力。
2、体内实验显示SLC44A1表达水平下调抑制裸鼠成瘤能力,提示SLC44A1在肺腺癌的发生、发展中起重要作用。
第四部分SLC44A1影响肺腺癌侵袭迁移的机制研究
方法
1、多因子检测技术和RT-PCR分析SLC44A1敲低后Calu-3和H322细胞48h上清中趋化因子的分泌水平,找出差异最显著的因子。
2、用ELISA方法验证差异趋化因子的表达。
3、在GEPIA平台进行SLC44A1与相关免疫因子的相关性分析。
4、应用RealTime-PCR检测人肺腺癌组织SLC44A1、CD68、CD163、CCL2、mRNA的表达,对SLC44A1影响肺腺癌转移的机制进行初步探讨。
结果
1、多因子检测、多因子RT-PCR及ELISA检测结果示:SLC44A1敲低后,H322细胞上清分泌CCL2水平下降。
2、数据库分析示:SLC44A1与CCL2、CD14、CD68、CD163、IL-10、IL-6均呈正相关关系。
3、肺腺癌组织中SLC44A1与CD68、CD163、CCL2呈正相关,推测其可能通过调节TAMs向M2型极化而发挥促肿瘤作用。
小结
SLC44A1敲低后,H322细胞上清分泌CCL2水平下降。数据库及临床样本验证SLC44A1与CD68、CD163、CD14、IL-10、IL-6呈正相关,且与趋化TAMs的CCL-2呈正相关,推测其可能通过调节M2型TAMs极化而发挥促肿瘤作用。
结论
1、通过对肺腺癌转移相关基因的生物信息学分析,筛选出22个在肺腺癌中显著差异表达的基因。通过生存预后验证,推测SLC44A1是肺腺癌转移中的关键基因。
2、经多个数据库平台验证,SLC44A1在包括肺腺癌在内的多种癌症中呈高表达。肺癌组织较癌旁组织高表达,转移病例较非转移病历高表达,人肺腺癌中SLC44A1高表达患者预后更差,提示其是预后不良的一个指标。
3、SLC44A1敲低抑制肺腺癌细胞的增殖、侵袭、迁移,抑制成瘤能力,推测该基因在肺腺癌恶性进程中起着重要作用。
4、SLC44A1敲低后,H322细胞上清分泌CCL2水平下降。免疫浸润分析显示SLC44A1与CD68、CD163呈正相关,且与趋化TAMs的CCL-2呈正相关,推测其可能通过调节M2型肿瘤相关巨噬细胞极化而发挥促肿瘤作用。
肺癌是世界范围内发病率和死亡率最高的恶性肿瘤之一。据我国国家癌症中心报道,肺癌发病率占全国恶性肿瘤发病首位,每年新发病例人数已上升至80万例,在男性肿瘤发病中占第1位,在女性肿瘤发病中仅次于乳腺癌,占第2位。肺癌死亡率亦居全国恶性肿瘤相关死亡首位,每年死亡病例约70万例。其在男性、女性癌症相关死亡中均占第1位。发病机制涉及原癌基因活化、抑癌基因失活、诱导血管生成、生长抑制逃逸、调节能量代谢、自反馈分泌环活化、免疫逃逸、抑制细胞凋亡等多个步骤,由此导致肿瘤细胞生长的失控,最终致使细胞的增殖、分化、信号传递、运动、凋亡等生理功能失调。早期肺癌通过手术治疗可以达到较好的治疗效果,但大多数肺癌在诊断初期已经出现局部侵犯或远处转移,丧失手术时机,且癌症相关死亡大多是因为肺癌侵袭和远处转移引起。近年来,生物靶向治疗和免疫治疗有效的改善了晚期转移性肺癌患者的生存期和生活质量,但因受限于继发耐药,转移性肺癌患者总体预后不佳,2年生存率仍然很低。
随着基因芯片技术和高通量测序技术快速发展,生物信息学分析被广泛应用于肿瘤基因功能研究领域,为肿瘤科学研究提供了海量生物信息学资料,使得癌症的研究进入多维度综合性分析的高度。在生物学数据库中对癌症相关生物学信息进行整合分析成为研究癌基因的有效手段,其中以GEO数据库为目前最大、最全面的存储基因芯片和高通量测序表达谱的公共数据库。国际癌症基因组图谱(The Cancer Genome Atlas, TCGA)数据库收录了多个癌症基因组学数据,包括表观遗传组数据、转录组数据、基因突变数据、蛋白组数据以及各癌症的临床数据,为肿瘤的发生发展相关机制研究及关键基因挖掘筛选提供了丰富的资源。公开的数据库资源为癌症研究人员提供了大量关于癌症基因学和表观遗传学数据,合理有效整合这些公开数据,可快捷发现癌症生物标记物和治疗靶点,为癌症的诊断、个体化精准治疗和预防提供依据。
本研究基于GEO数据库,筛选出肺腺癌转移相关的基因芯片样本集,通过R语言分析分别得到关于肺腺癌高转移性的差异表达基因集,对差异表达基因分别进行GO功能富集分析及Pathway分析,对样本集的差异表达基因分析得出共表达差异基因,在GEPIA数据平台进行生存分析,利用Oncomine、Kaplan-MeierPlotter等在线分析平台通过TCGA等数据库中肺腺癌的相关临床信息对共表达基因进行验证,最终选取肺腺癌细胞和癌旁组织中差异表达且与患者总生存时间密切相关的基因SLC44A1为肺腺癌转移关键基因。我们首先在配对的肺腺癌组织和癌旁组织中分析其与临床病理特征的相关性。用免疫组化方法验证肺腺癌组织中SLC44A1蛋白的表达并分析其与患者预后的相关性。随后我们在体内、体外实验中研究了SLC44A1对肺腺癌细胞Calu3、H322增殖、侵袭、迁移、细胞凋亡、自我更新能力、移植成瘤等生物行为的影响,最后从免疫浸润方面对SLC44A1影响肺腺癌转移的机制进行了初步探讨。
第一部分肺腺癌转移相关基因的生物信息学分析和筛选
方法
1、在GEODataSets中以“lungadenocarcinoma”、“metastasis”为关键词进行检索,筛选符合肺腺癌转移的样本集。
2、分别下载保存样本集CEL数据文件和对应的平台探针文件。使用R软件对芯片软件进行预处理。
3、以转移组为实验组,以非转移组为对照组。利用R软件中的limma包对两个样本集分析差异表达基因,以|logFC|>1且adj.p<0.05为纳入标准,筛选显著差异基因。
4、对样本集的差异基因进行共表达分析,获取肺腺癌转移相关的关键基因。
5、在GEPIA在线平台对显著差异基因进行预后验证,选取与肺腺癌预后高度相关的基因作为关键基因。
结果
1、筛选到符合肺腺癌转移相关的2个基因芯片原始数据样本集GSE76194和GSE42407,上述2个样本集的基因芯片平台文件均为GPL570。
2、样本集GSE76194肺腺癌部分包含8个样本,样本集GSE42407中包含6个样本,预处理后矩阵数据标准化效果良好,可进行后续分析。
3、获取差异表达基因后,以|logFC|>1且adj.p<0.05为纳入标准筛选显著差异基因,GSE76194中共199个显著差异基因,107个上调基因和92个下调基因。GSE42407中共3278个显著差异基因,2601个上调基因和677个下调基因。
4、对2组差异基因进行共表达分析发现,2个样本集中共表达基因共22个,其中上调基因18个,下调基因4个.
5、对共表达基因进行GO功能富集分析及Pathway分析结果显示其生物功能富集癌症相关通路。
6、通过GEPIA在线平台验证,SLC44A1与患者预后显著相关,高表达组患者生存率明显低于低表达组。
小结
1、分析肺腺癌转移相关基因芯片GSE76194和GSE76194的差异表达基因,对2个样本集差异基因进行共表达分析后筛选出18个上调基因和4个下调基因。
2、通过在线生存验证,推测SLC44A1在肺腺癌发生、侵袭、转移中发挥着重要作用。
第二部分SLC44A1在肺腺癌中的表达及临床意义
方法
1、在Oncomine和TIMER数据库中进行SLC44A1在不同癌症中的表达水平分析。
2、下载TCGA中肺腺癌RNA-seq数据,分析肺腺癌临床样本中SLC44A1的表达情况。匹配临床信息数据,分析肺腺癌临床样本中SLC44A1的生存相关性。
3、采用RealTime-PCR检测肺腺癌组织和癌旁组织中SLC44A1mRNA的表达水平,分析其与临床病理参数的相关性。
4、应用免疫组化方法检测SLC44A1蛋白在肺腺癌组织和癌旁正常组织中的表达,分析其与临床病理参数的相关性。
5、分析SLC44A1的表达水平与患者生存预后的相关性。
结果
1、Oncomine和TIMER数据库结果均显示SLC44A1在乳腺癌、宫颈癌、头颈部癌、肺癌、淋巴瘤、胰腺癌等中高表达;在膀胱癌、乳腺癌、结直肠癌、肾癌、肝癌中低表达。
2、TCGA数据库中发现SLC44A1在肺腺癌组织中表达高于正常组织,转移肺腺癌(M1)中表达高于非转移肺腺癌(M0),差异均有统计学意义。
3、68例配对的肺腺癌组织中SLC44A1mRNA的表达显著高于癌旁正常组织(p<0.05),且其在癌组织中的表达水平与淋巴结转移、肿瘤分期和生存状态显著相关(p<0.05)。
4、肺腺癌组织中SLC44A1蛋白表达水平显著高于癌旁正常组织(p<0.05),且其在癌组织中的表达与淋巴结转移、肿瘤分期和生存状态显著相关(p<0.05)。
5、SLC44A1的表达与患者生存相关,高表达患者预后更差。
小结
1、SLC44A1在包括肺腺癌在内的多种癌症中呈高表达。
2、SLC44A1在肺腺癌组织中表达高于癌旁正常组织,转移组患者表达更高,且与患者原发肿瘤范围、淋巴结转移、肿瘤分期相关。高表达患者预后更差。提示SLC44A1可能参与肺腺癌恶性进程。
第三部分SLC44A1对肺腺癌细胞生物行为的影响
方法
1、应用RealTime-PCR检测SLC44A1mRNA在三株人肺腺癌细胞系及人正常肺支气管上皮细胞系中的表达。
2、构建SLC44A1稳定敲低的肺腺癌细胞系,用WesternBlot和Realtime-PCR方法验证SLC44A1的敲低效率。
3、平板克隆实验和细胞增殖实验(CCK8)检测肺腺癌SLC44A1敲低对细胞增殖能力的影响。
4、应用划痕和Transwell实验检测SLC44A1敲低对肺腺癌细胞侵袭迁移能力的影响。
5、超低粘附成球培养实验检测SLC44A1敲低对肺腺癌自我更新能力的影响。
6、构建裸鼠肺腺癌移植瘤模型,观察瘤体生长,检测肿瘤部位SLC44A1及增殖侵袭相关指标的表达。
结果
1、SLC44A1在肺腺癌细胞株A549、Calu-3、H322中表达明显高于人肺支气管上皮细胞系BEAS-2B。
2、选择SLC44A1表达相对较高的肺腺癌细胞株Calu-3、H322构建其稳定敲低的细胞系。
3、敲低SLC44A1基因能抑制Calu-3、H322的增殖、侵袭、迁移,但对肺腺癌细胞自我更新能力无明显影响。
4、在裸鼠成瘤实验中,敲低SLC44A1基因能抑制裸鼠成瘤能力,其肿瘤部位SLC44A1和增殖侵袭相关指标ki-67和MMP9表达均下调。
小结
1、体外实验显示用shRNA稳定敲低SLC44A1的表达水平可以显著降低肺腺癌细胞的增殖和迁移侵袭能力、但不影响肺腺癌细胞的成球的能力。
2、体内实验显示SLC44A1表达水平下调抑制裸鼠成瘤能力,提示SLC44A1在肺腺癌的发生、发展中起重要作用。
第四部分SLC44A1影响肺腺癌侵袭迁移的机制研究
方法
1、多因子检测技术和RT-PCR分析SLC44A1敲低后Calu-3和H322细胞48h上清中趋化因子的分泌水平,找出差异最显著的因子。
2、用ELISA方法验证差异趋化因子的表达。
3、在GEPIA平台进行SLC44A1与相关免疫因子的相关性分析。
4、应用RealTime-PCR检测人肺腺癌组织SLC44A1、CD68、CD163、CCL2、mRNA的表达,对SLC44A1影响肺腺癌转移的机制进行初步探讨。
结果
1、多因子检测、多因子RT-PCR及ELISA检测结果示:SLC44A1敲低后,H322细胞上清分泌CCL2水平下降。
2、数据库分析示:SLC44A1与CCL2、CD14、CD68、CD163、IL-10、IL-6均呈正相关关系。
3、肺腺癌组织中SLC44A1与CD68、CD163、CCL2呈正相关,推测其可能通过调节TAMs向M2型极化而发挥促肿瘤作用。
小结
SLC44A1敲低后,H322细胞上清分泌CCL2水平下降。数据库及临床样本验证SLC44A1与CD68、CD163、CD14、IL-10、IL-6呈正相关,且与趋化TAMs的CCL-2呈正相关,推测其可能通过调节M2型TAMs极化而发挥促肿瘤作用。
结论
1、通过对肺腺癌转移相关基因的生物信息学分析,筛选出22个在肺腺癌中显著差异表达的基因。通过生存预后验证,推测SLC44A1是肺腺癌转移中的关键基因。
2、经多个数据库平台验证,SLC44A1在包括肺腺癌在内的多种癌症中呈高表达。肺癌组织较癌旁组织高表达,转移病例较非转移病历高表达,人肺腺癌中SLC44A1高表达患者预后更差,提示其是预后不良的一个指标。
3、SLC44A1敲低抑制肺腺癌细胞的增殖、侵袭、迁移,抑制成瘤能力,推测该基因在肺腺癌恶性进程中起着重要作用。
4、SLC44A1敲低后,H322细胞上清分泌CCL2水平下降。免疫浸润分析显示SLC44A1与CD68、CD163呈正相关,且与趋化TAMs的CCL-2呈正相关,推测其可能通过调节M2型肿瘤相关巨噬细胞极化而发挥促肿瘤作用。