论文部分内容阅读
脑胶质瘤是最常见的中枢神经系统恶性肿瘤,根据肿瘤良恶性程度,可以分为高级别脑胶质瘤和低级别脑胶质瘤。近年来,基因层面的研究已经被证实在脑胶质瘤预测和预后上具有很大的价值。但是仅仅基于分子层面对脑胶质瘤进行分级研究是不完整的。因此对脑胶质瘤在组织层面进行准确分级是进行分子诊断的基础,在脑胶质瘤患者临床诊断治疗上起着重要的作用。目前,临床上使用手术或活检的方法对肿瘤进行化验分级。但是这种方法由于手术侵入性和肿瘤的异质性使得它具有很大的局限性。作为一种无创性工具,磁共振成像(MR)在胶质瘤诊断中起着重要作用。大部分关于脑胶质瘤MR图像的研究都是针对单模态,或者是重点研究MR图像的一阶特征,如平均值和最大、小值等统计学特征,并不能完整的表示肿瘤的表型信息。基于这种现状,本文使用2015年BRATS提供的脑胶质瘤MR图像样本集,高通量的从多模态脑胶质瘤MR图像中提取影像组学特征,使用支持向量机-递归消除法对特征进行选择,获得能够表示脑胶质瘤表象特征的最优特征子集,然后使用XgBoost算法训练分类器,作为对比本文也使用ERT和SVM两种方法进行分类训练。本文从脑胶质瘤四个模态MR图像中,总共提取了 420个影像组学特征。这些特征数据量庞大,具有很多无关特征和噪声,无法直接用于分类器训练研究。所以需要先进行特征选择,本文在特征选择环节使用的是支持向量机-递归消除法,整个过程中使用5-折交叉验证方法,对样本总集进行五次特征选择,获得五个最优特征子集,将这些特征子集中共同包含的特征作为特征选择的结果。可以发现多数的纹理特征和T1c模态中的特征被选择出来,说明纹理特征和T1c模态图像在高、低级别脑胶质瘤的分类中起到很重要的作用。这点研究发现和目前比较先进的国内外研究结论一致。本文最后使用XgBoost算法训练分类器,对样本集使用5-折交叉验证来评价分类器性能,同时使用ERT和SVM两种算法训练分类器作为对比,研究实验显示,XgBoost分类器的精度、查准率、查全率和F1分别为:91.25%、91.63%、91.25%和91.06%,均高于ERT和SVM两个分类器。这点也说明本文中采用XgBoost算法在本次良恶性肿瘤分级预测研究上具有很大的优越性。本文设计的分类训练器具有较高的精度,可以用于协助医生诊断脑胶质瘤的良恶性,是进一步分子诊断的基础。