论文部分内容阅读
化疗作为卵巢癌主要诊疗手段之一,费用昂贵,副作用大,并且患者化疗反应的个体差异很大,因此迫切需要一种能有效辨别化疗反应的方法。微阵列技术的发展为人类从基因的角度,全面研究和分析化疗疗效相关基因提供了条件。在这一背景下,论文以卵巢癌化疗反应基因芯片数据分析为主题,围绕基因表达数据的预处理、特征基因提取两个方面的问题进行了深入分析和研究,其主要内容和创新之处包括:(1)提出了辨识基于非生物因素影响的基因芯片数据的预处理方法。不同实验平台芯片技术上的差异会导致基因表达谱数据内部本质上的差别。针对这种基因芯片的实验室效应问题,论文提出一种基于图形的方法把一些非生物因素对基因表达的影响直观地显示出来,和基于统计学方法定量地分析非生物因素对基因表达的影响,再通过数据的预处理方法去除这些非生物因素的影响,最后检验预处理后的微阵列数据是否已去除这些非生物因素。由实验结果可得,批次的不同对基因的差异表达较为明显;实验室条件对基因的差异表达水平也有一定的影响。通过行均值归一化的方法,预处理后的基因芯片数据,不同批次、不同实验室条件这些非生物因素的噪声已几乎消除。(2)基于卵巢癌化疗反应相关性的敏感基因辨识。基于微阵列数据的卵巢癌敏感基因选择研究中,过滤法和缠绕法单纯以差异表达或分类率,而非生物相关性来选择基因,结果的生物相关性差,针对这个问题,提出了一种优先考虑诊断结果(卵巢癌化疗疗效)相关性的特征选择策略。首先利用奇异值分解定性地、定量地分析生物和非生物因素对基因表达的影响,并结合样本化疗反应的聚类特性来选取备选基因,然后使用基于信息增益的随机森林方法精选基因。对比实验表明,这种方法相对经典方法具有明显优势:选取出的特征基因更稳定且具有较好的模式分类能力;统计分析显示,辨识出的基因与化疗疗效的联系更加紧密;相关研究也证实,这种方法得到更多与卵巢癌相关的基因。(3)发现了一些和化疗相关的基因。论文提取出45个不同的基因,大部分基因的生物功能明显与影响卵巢癌化疗的因素相关,其中辨识出的PURA基因是公认的基于顺铂药物的卵巢癌化疗反应的标志物,有4个基因的生物功能与卵巢癌直接相关:NR2F2,CLDN3,PURA,C1ORF38;有17个基因与肿瘤,癌症,免疫反应或炎症反应相关:USO1,TCF7L2,NR2F2,MGEA5,CLDN3,DUSP6,ENO1,TANK,VLDLR,DDAH1,SMARCA2,C1ORF38,SLC22A5,PURA,ACTR2,MAP3K4,OGT。论文通过机器学习的方法筛选出卵巢癌化疗疗效相关的基因,并且这些基因的生物功能与卵巢癌化疗疗效有较大的相关性,对从基因角度研究卵巢癌化疗疗效提供了一定的理论依据,而且对相关肿瘤研究也具有一定的借鉴意义。