论文部分内容阅读
为了识别肺癌发展过程中的关键基因,揭示其发展的潜在机制,得到肺癌的预测模型,从GEO(Gene Expression Omnibus)数据库下载了基因芯片GSE19188和GSE40791进行研究。首先对基因表达数据分析得到805个同趋势差异表达基因(differentially expressed genes, DEGs),构建特异蛋白质交互(protein-protein interaction , PPI)网络。再通过基因在网络中的度和表达偏差得分乘积筛选出209个肺癌发展的关键基因。关键基因在11条细胞通路中显著富集,根据这些通路的差异得分可以清楚辨别癌症样本和正常样本。最后利用通路中18个串话基因结合支持向量机算法建立肺癌的预测模型。经测试模型分类准确性达到97%,表明这18个基因作为肺癌预测基因有较好的稳健性和敏感性,可作为肺癌的预测标记物和化疗的靶点。