论文部分内容阅读
目的:①探讨肺癌基因突变与病理分型的关联性,为肺癌的病理诊断、恶性程度的判断、预后的评估及个体化治疗的选择提供理论依据;②比较肺癌前20位突变基因的蛋白序列,推测出同源基因,验证不同病理分型下同源基因之间的突变情况是否一致,为基因的功能研究提供参考价值。方法:①选择COSMIC数据库进行挖掘,获取所有已被文献报道的肺癌大样本突变数据,包括突变部位、病理分型、全部突变基因以及每个突变基因的样本数据(点突变、拷贝数变异、基因表达和DNA甲基化),经整理和转换,对大样本数据采用频数分析和构成比进行统计描述。②根据各基因在样本中的突变频率筛选出肺癌前20位突变基因(突变率<5%),采用/检验分析各基因点突变、拷贝数变异、基因表达及DNA甲基化与病理分型之间的关联,组间两两比较采用/分割法。③通过Uniprot蛋白数据库获取前20位突变基因的蛋白序列,采用MEGA5.1分子进化分析软件,对蛋白序列进行聚类,并构建系统进化树,再采用Boostrap法进行验证,根据聚类图上各蛋白的相似度高低,推测出同源基因,采用/检验对同源基因不同病理分型的突变情况进行分组分析。④采用K-means聚类法将前20位突变基因进行样品聚类。结果:①肺癌中突变率最高的基因为TP53(32.32%),其次为EGFR(29.12%)、KRAS(16.09%)。。②TP53、EGFR、KRAS、LRP1B、CDKN2A、STK11、FAT4、KMT2C、KMT2D、NFE2L2、KEAP1、PIK3CA RB1、ERBB4、CREBBP和GRIN2A基因各病理分型间的样本突变率有差别 均有 P<0.05)。③KRAS、LRP1B、CDKN2A、KAMT2C、FAT1、PIK3CA、RB1、ERBB4、GRIN2A和KDR基因各病理分型间样本的拷贝数变异率有差别(均有P<0.05)。④TP53、KRAS、LRP1B、CDKN2A、STK11、FAT4、KMT2D、NFE2L2、KEAP1、PIK3CA、RB1、EB、SMARCA4和KDR基因腺癌与鳞癌样本之间的基因差异表达率有差别(均有P<0.05)。⑤CDKN2A基因表现为DNA超甲基化,其余3个基因均表现为DNA低甲基化,FAT1和GRIN2A基因腺癌与鳞癌样本间的DNA甲基化发生率有差别。⑥EGFR和ERBB4的蛋白序列相似度达93%,同源性高,FAT4和FAT1的蛋白序列相似度为81%,同源性较好,且两组蛋白序列的Bootstrap值均大于70,可信度较好。⑦对于小细胞癌样本,两组同源基因的点突变和拷贝数变异情况都没有差异。对于腺癌样本,FAT和FAT1基因的点突变和拷贝数变异情况都没有差异。对于鳞癌样本,两组同源基因的点突变情况没有差异。⑧前20位突变基因样品聚类中TP53和EGR被聚成一类,PIK3CA单独成一类,其他17个基因聚为一类。结论:①肺癌相关基因的点突变、拷贝数变异、基因表达和DNA甲基化与病理分型存在着一定的关联性,突变基因不同,其间的关系也存在差异。②肺癌前20位突变基因中,EGFR和ERBB4同源,FAT4和FAT1同源。③小细胞癌样本中两组同源基因的点突变和拷贝数变异情况都没有差异。腺癌样本中FAT4和FAT1基因的点突变和拷贝数变异情况都没有差异。鳞癌样本中两组同源基因的点突变情况没有差异。