论文部分内容阅读
研究背景和目的肺癌是世界上致死率最高的肿瘤,其中非小细胞肺癌占大多数(约占85%),非小细胞肺癌主要由肺鳞癌及肺腺癌构成。近年来靶向治疗的进展,使肺腺癌患者明显获益。EGFR突变为靶向治疗提供了靶点,EGFR突变主要存在于肺腺癌中,仅有少部分存在于肺鳞癌中。非小细胞肺癌患者一旦确诊多为肺腺癌或肺鳞癌,一些患者或患者家属可能想知道患者的生存时间。目前尚缺乏关于肺鳞癌及不同EGFR突变状态下肺腺癌的个体化预测模型,因此迫切需要一个可以帮助患者及家属了解病情的预测模型。近年来针对其他的一些实体瘤如食管癌、鼻咽癌、乳腺癌等[1-3]通过构建列线图预测模型可以较为准确的个体化预测患者的生存时间,实现了这一目标。列线图的建立是在一方程式的基础上,将所要研究的变量代入方程式中,画出多个标尺,用一直尺就能读出不同情况下的数值。列线图的构建是整合了多个自变量及研究的终点事件(如年龄、TNM分期、生存状态、生存期)等指标,并且以统计学分析为基础,研究某种特征的生物体发生某个终点事件的概率(如患糖尿病的概率、肿瘤患者获得3年生存的概率等),对生物体个体化的发展起到一定的促进作用[4-8]。本研究拟构建肺鳞癌及不同EGFR突变状态下肺腺癌患者总生存期的列线图(Nomogram)模型,并验证其准确性,帮助患者及患者家属对病情有初步了解,并为完善大数据分析做准备。方法1、获取临床数据应用R3.5.1软件,安装R语言中的readr程序包及bioconductor中的TCGAbiolinks程序包,运行TCGA数据库下的程序参数(GDC:https://portal.gdc.cancer.gov/)、加载上述程序包、设置环境参数及程序参数,然后运用R语言进行编程,筛选出TCGA数据库中1991年至2013年1026例NSCLC患者,其中肺鳞癌504例、肺腺癌522例。2、筛选临床数据根据同一患者中有完整年龄、性别、T分期、N分期、M分期、放疗、药物治疗、生存期、生存状态等指标的肺鳞癌数据进行筛选,筛选出符合要求的数据420例。根据同一患者中有完整年龄、性别、EGFR突变状态、T分期、N分期、M分期、放疗、药物治疗、生存期、生存状态等指标的肺腺癌数据进行筛选,筛选出符合要求的数据195例。3、COX结果分析本研究运用SPSS软件下的COX回归方法对肺鳞癌及肺腺癌分别进行生存分析,单因素分析结果可以提示与患者生存相关的潜在危险因素(P<0.05),多因素分析结果可以提示与患者生存相关的独立危险因素(P<0.05)。4、列线图的构建运用R软件下的R程序包如rms、survival、foreign等,对肺鳞癌及肺腺癌数据建立各自列线图预测模型。相加各项预测因素得分计算出总分,获得相对应的3年及5年生存期概率。5、列线图的验证运用R软件下的R程序包如rms、survival、foreign、rmda等,对肺鳞癌及肺腺癌进行C-index指数的计算、校准曲线(图)及决策曲线的绘制,验证列线图的准确性。结果:在肺鳞癌中,COX单因素分析显示:年龄(1.80*10-2)是肺鳞癌患者总生存期(OS)的潜在危险因素,COX多因素分析表明:年龄(1.40*10-2)是影响肺鳞癌患者总生存期(OS)的独立危险因素。在肺腺癌中,COX单因素分析显示:N分期(2.00*10-6)是肺腺癌患者总生存期(OS)的潜在危险因素,COX多因素分析表明:N分期(2.00*10-5)、EGFR突变状态(4.60*10-2)是影响肺腺癌患者总生存期(OS)的独立危险因素。肺鳞癌及肺腺癌的C-index指数分别为0.635、0.781。肺鳞癌及肺腺癌的3年及5年生存期的校准图形中均显示标准曲线与预测曲线高度重合。肺鳞癌及肺腺癌的决策曲线在较大阈值范围(肺鳞癌:18%-58%,肺腺癌:4%-76%)有理想的净获益率。结论:从本研究可以得出如下结论:肺鳞癌1、肺鳞癌患者总生存期(OS)的潜在危险因素:年龄。2、肺鳞癌患者总生存期(OS)的独立危险因素:年龄。3、我们构建的基于肺鳞癌患者年龄、性别、T分期、N分期、M分期、放疗及药物治疗等因素的列线图可以较准确的个体化预测肺鳞癌患者总生存时间。肺腺癌1、肺腺癌患者总生存期(OS)的潜在危险因素:N分期。2、肺腺癌患者总生存期(OS)的独立危险因素:N分期及EGFR突变状态。3、我们构建的基于肺腺癌患者年龄、性别、T分期、N分期、M分期、EGFR突变状态、放疗及药物治疗等因素的列线图可以较准确的个体化预测肺腺癌患者总生存时间。