论文部分内容阅读
影像组学(Radiomics)是一种从放射图像中提取海量的定量图像特征,创建可挖掘数据的技术,能够为临床诊断、预后预测或者临床决策提供有价值的信息。目前,已有大量的研究证明了影像组学在器官毒性预测、生存状态分析以及肿瘤的良恶性分类等方面的优越性。然而从实践的角度来看,在管理各种不同模态的特征源(如手动提取的特征,临床特征和自动学习得到的特征等)以及根据分类器的偏好选择合适的分类器模型以完成特定的预测任务等方面仍然存在挑战。本文针对选择合适分类器的问题,提出一种新型的多分类器融合算法,规避了选择“最适合”分类器的过程,并在此算法的基础上构建了多模态分层融合框架,为组合不同模态的特征提供一种新的思路,主要内容如下:一、基于多准则决策(Multi-criterion decision-making,MCDM)的多分类融合算法(MCF)。本研究将分类器融合看成是一个多准则决策的过程,将不同的分类器看成一组替代方案,通过评估某些特定的评价指标或者评价标准来为每一个替代方案分配一个权重。本文于UCI数据库中选择了 10套二分类的数据集来对该融合算法进行验证,结果显示与其他常用的5种分类器融合方法相比在准确率(accuracy)、受试者工作特征(Receiver Operating Characteristic,ROC)曲线下的面积(Area Under Curve,AUC)、灵敏度(sensitivity)和特异性(specificity)上均取得了较好的效果。统计分析的结果显示,基于当前10套数据,该方法与其他五种融合算法在accuracy和AUC上均存在统计学差异。二、多模态特征及多分类器分层融合框架。本研究基于提出的多分类器融合算法构建了一种分层的多模态特征及多分类器融合框架,对于多模态、多分类器的问题,首先在分类器层面上进行第一层融合,然后在多模态的层面上进行第二层融合。本文对该分层模型的验证主要分为以下几个方面:第一,非小细胞肺癌患者的生存预测研究。通过融合临床指标和影像组学特征以及5种不同的基分类器对非小细胞肺癌患者的生存状态进行预测,与其他融合框架相比,在accuracy、AUC、sensitivity和specificity上都取得了较好的效果,分别为0.75、0.81、0.73和0.80。第二,前列腺癌放疗的直肠毒性预测研究。通过融合临床指标和剂量学特征两种不同模态的特征,在accuracy、AUC、sensitivity和specificity上取得了最好的效果,分别为0.78,0.83,0.76和0.79。三,多模态多通道乳腺组织良恶性分类研究。本研究是在前面两项研究的基础上,将分类器融合算法从二分类推广到多分类,对融合框架的结构进行了一点改变,以适应于乳腺组织多分类问题的研究。融合数字乳腺断层摄影(Digital Breast Tomosynthesis,DBT)和数字化乳腺摄影(Full-field Digital Mammography,FFDM)两种模态的信息,手动提取特征与深度卷积神经网络(Deep Convolutional Neural Network,DCNN)自动提取的特征相结合,构建了一个较为精准的乳腺组织预测模型,在预测准确性方面马修斯相关系数(Matthews Correlation Coefficient,MCC)达到 81.72%。在本文中,我们提出了一种多分类器融合的算法以及一种分层的多模态融合框架,并在10个UCI公开数据库以及3个临床应用方向上对该算法及框架进行验证,实验结果显示该算法及框架均具有可行性和有效性。