基于lncRNA表达谱的乳腺癌综合预后预测模型的建立

来源 :山东大学 | 被引量 : 0次 | 上传用户:king_caspe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
研究背景乳腺癌是威胁女性健康的最常见恶性肿瘤,其高度异质性使患者在病情进展、治疗反应及预后等方面显现出明显的差异,其中人表皮生长因子受体2(human epidermal growth factor receptor 2,HER2)阳性乳腺癌术后复发率和死亡率态势尤为严峻。长链非编码RNA(long non-coding RNA,lncRNA)是一类在肿瘤恶性演化中发挥关键作用的新兴非编码RNA。本研究旨在利用癌症基因组图谱(The Cancer Genome Atlas,TCGA)数据库中乳腺癌患者的RNA表达谱及临床病理数据,从基因组水平挖掘对预后具有更高预测价值的新型分子标志物,并构建可个体化预测患者生存概率的列线图;此外,针对HER2阳性乳腺癌患者,建立可精准预测患者预后风险的lncRNA风险评分模型,以期为乳腺癌的临床精准诊疗提供较为全面的预后评估系统。第一部分:乳腺癌预后列线图的建立及LHX1-DT在乳腺癌进展中的功能研究目的:探究乳腺癌的独立预后因素,构建可精准预测患者3年和5年生存概率的预后列线图,初步明确模型中关键lncRNA分子在乳腺癌进展中的作用。方法:1.下载TCGA数据库中1109例乳腺癌患者及113例健康对照者的RNA表达谱及临床病理数据,利用R语言“DESeq2”软件包鉴别在乳腺癌组织和乳腺正常组织之间差异表达的lncRNAs(differently expressed lncRNAs,DELs)。基于Kaplan-Meier生存分析和单因素Cox回归分析,进一步筛选获得与乳腺癌患者预后有关联性的DELs作为候选分子。2.在训练集中,利用多因素Cox回归分析(向前逐步回归)进一步筛选得到关键预后lncRNAs,以此构建lncRNA风险评分模型。在训练集、验证集和总样本集中,通过Kaplan-Meier生存分析和时间依赖性受试者工作特征曲线(receiver operating characteristic curve,ROC)评估该模型的预测价值。进一步采用Kaplan-Meier分层生存分析和Cox回归分析检测该模型对患者预后的预测独立性,并筛选乳腺癌的独立预后因素。3.利用R语言“rms”软件包整合lncRNA风险评分模型与上述独立预后因素,构建可预测乳腺癌患者3年和5年生存概率的列线图。在训练集、验证集和总样本集中,运用一致性指数(concordance index,C-index)、校正曲线和时间依赖性ROC曲线评估该列线图的区分度、一致性和预测效能,同时采用时间依赖性ROC曲线比较该列线图与lncRNA风险评分模型及其他独立预后因素的预测效能。4.针对lncRNA风险评分模型中的分子进行功能富集分析,探索其参与的生物学功能。选取关键预后lncRNA,利用原位杂交(In situ hybridization,ISH)检测该lncRNA在乳腺癌组织和乳腺正常组织之间的表达水平。Kaplan-Meier生存分析检测该lncRNA的表达水平与患者预后之间的关联性。5.通过对乳腺癌细胞转染特异性siRNA及shRNA,构建关键预后lncRNA敲减细胞株。采用EdU掺入实验、RTCA细胞增殖实验和克隆形成实验,检测敲低lncRNA对乳腺癌细胞增殖能力的影响。通过注射稳定敲减细胞株构建裸鼠移植瘤模型,进一步分析该lncRNA对乳腺癌体内生长的影响。结果:1.经差异分析共获得1103个DELs,其中794个DELs在乳腺癌组织中上调,309个DELs呈现下调。单因素Cox回归分析和Kaplan-Meier生存分析发现71个DELs与患者预后有统计学意义的关联性。2.在训练集中,通过多因素Cox逐步回归分析进一步筛选出10个关键预后相关lncRNAs,以此建立了 10-lncRNAs风险评分模型:风险评分=(0.634 ×表达量AL138789.1)+(0.4887×表达量AL513123.1)+(0.254 × 表达量LINC00536)+(0.262 ×表达量BCAR4)+(0.825 × 表达量AC079414.1)+(0.253 × 表达量LHX1-Dt)+(1.115 ×表达量AC006262.3)+(-0.779 × 表达量MIR3 1 50BHG)+(-1.414 × 表达量AC105398.1)+(-0.739 ×表达量AL133467.1)。Kaplan-Meier生存分析显示该模型可有效鉴别预后高风险患者和低风险患者(P<0.0001);时间依赖性ROC曲线表明该模型3年和5年生存率的曲线下面积(area under ROC curve,AUC)分别可达0.886(95%置信区间confidence interval,[CI]:0.792-0.979)和 0.911(95%CI:0.835-0.987)。3.在验证集和总样本集中,10-lncRNAs风险评分模型仍展现出良好的预后预测价值。该模型在验证集中3年AUC为0.574(95%CI:0.400-0.748)、5年AUC为 0.650(95%CI:0.482-0.817);在总样本集中,其 3 年和 5 年AUC分别为 0.734(95%CI:0.618-0.849)和 0.781(95%CI:0.688-0.875)。Kaplan-Meier分层生存分析结果显示,在不同年龄、TNM分期、雌激素受体(estrogen receptor,ER)状态、孕激素受体(progesterone receptor,PR)状态、三阴性乳腺癌和HER2阴性乳腺癌亚组中,该模型依旧可有效地区分出预后高风险患者和低风险患者,且高风险和低风险患者的总生存期有统计学意义的差异。单因素和多因素Cox回归分析表明,10-lncRNAs风险评分模型、TNM分期与HER2状态均为乳腺癌患者的独立预后因素。4.通过整合上述独立预后因素,成功构建可预测患者3年和5年生存概率的预后列线图。在训练集、验证集和总样本集中,该列线图的C-index分别为0.891、0.813和0.851;三个样本集中的校正曲线均表明由该列线图预测的生存概率和患者实际生存率具有较高的一致性;时间依赖性ROC曲线结果显示该列线图对患者5年生存率的AUC可达0.804,优于10-lncRNAs风险评分模型(AUC=0.781)、年龄(AUC=0.614)、HER2(AUC=0.600)和TNM分期(AUC=0.582)。5.功能富集分析表明该模型中10个预后lncRNAs主要富集在DNA复制和染色体分离等生物学过程和p53与卵母细胞减数分裂等信号通路。组织芯片ISH结果显示关键预后lncRNA LHX1-DT在乳腺癌组织中显著上调(P<0.05),其高表达与患者预后不良相关联(P<0.05)。6.通过对乳腺癌细胞转染特异性siRNA及shRNA,成功构建LHX1-DT敲减细胞系,EdU掺入实验、RTCA细胞增殖实验和克隆形成实验结果显示,LHX1-DT可显著增强乳腺癌细胞的体外增殖能力(P均小于0.05)。裸鼠成瘤实验进一步发现LHX1-DT敲低组的移植瘤生长较对照组显著减慢(P<0.05)。结论:1.基于lncRNA表达谱,本研究构建可预测乳腺癌患者预后风险的10-lncRNAs风险评分模型,该模型是患者预后的独立危险因素。2.整合10-lncRNAs风险评分模型和其他临床独立预后因素,本研究成功建立了乳腺癌预后列线图,该列线图能够可视化预测患者3年和5年生存概率,将为乳腺癌的个体化诊疗提供新的思路。3.乳腺癌预后lncRNA可能通过影响DNA复制和细胞分裂参与肿瘤的恶性进展,其中关键预后lncRNA LHX1-DT在乳腺癌中异常上调并显著促进细胞的增殖,将为寻找新的乳腺癌治疗靶点提供参考。第二部分:HER2阳性乳腺癌患者预后风险评分模型的建立目的:基于TCGA数据库构建可预测HER2阳性乳腺癌患者预后的lncRNA风险评分模型。方法:1.从TCGA数据库中获取161例HER2阳性乳腺癌患者和113例健康对照者的RNA表达谱及临床病理数据,通过R语言“DESeq2”软件包、Kaplan-Meier生存分析和单因素Cox回归分析,鉴定在HER2阳性乳腺癌中差异表达且与患者OS相关联的DELs。2.运用多因素Cox回归分析(向前逐步回归)在训练集中进一步筛选出独立的预后相关lncRNAs并构建风险评分模型。通过时间依赖性ROC曲线和Kaplan-Meier生存分析评估该模型在训练集、验证集与总样本集中的预测效能。此外,依据TNM分期、ER状态和PR状态分别将总样本集内患者分为各个亚组,利用Kaplan-Meier生存分析检测该模型在各亚组中的预测效能。结果:1.本研究共鉴定出25个与患者预后相关联的DELs,其中3个lncRNAs(LINC01833、LINC00536和LINC02725)为患者的独立预后危险因素。2.依据多因素Cox逐步回归分析结果对3个预后相关lncRNAs的表达量进行加权,成功构建3-lncRNAs风险评分模型:风险评分=0.710 ×表达量LINC01833+1.869 ×表达量LINC00536+2.992 ×表达量LINC02725。在各样本集中,Kaplan-Meier生存分析结果显示,该模型均可依据患者风险评分的高低将患者分成预后高风险和低风险组,且高风险组患者的总生存率明显低于低风险组(P<0.05)。时间依赖性ROC曲线表明该模型的5年AUC可达0.825,高于模型中任一lncRNA 分子的 AUC(AUCLINC01833=0.787;AUCLINC00536=0.735;AUCLINC02725=0.702),且优于TNM分期(AUC=0.605)、ER状态(AUC=0.546)和PR状态(AUC=0.554)。此外,在ITNMⅠ-Ⅱ期亚组、ER阳性亚组、PR阴性亚组和PR阳性亚组中,3-lncRNAs模型也可准确区分出总生存率较低的预后高风险患者。结论:3-lncRNAs风险评分模型可较准确地预测HER2阳性乳腺癌患者的预后风险,有望为该类患者的临床个体化管理提供新的参考依据。
其他文献
1950年5月1日,在周恩来、陈毅、郭沫若、胡乔木等领导同志的大力支持下,由胡愈之先生创办的世界语版《中国报道》(当时刊名为《人民中国报道》)面世了。如今,已经过去了整整70年。这70年,有多少笔墨、多少故事、多少风流?  70年,几代人与《中国报道》一起记录历史的变迁,共同见证着时代的行进。从一本刊物到多本刊物,从世界语到多语种,从新闻出版到多媒体矩阵,《中国报道》几经变迁,但始终不变的是向世界
不间断电源作为一种能够保证不间断供电的系统设备,近年来在医院、银行、学校、机关、电力通信等各个行业的电力系统中都有着非常广泛的应用,并在保证供电的稳定性、可靠性、
在煤炭开采中受采动的影响,掘进工作面巷道的矿压变化速度快,采场周围的岩层随之发生运动和应力分布的变化,使巷道发生变形,甚至遭受破坏,给回采期间的安全管控增添难度。本