论文部分内容阅读
由于胶质母细胞瘤(Glioblastoma multiforme,GBM)的异质性特点,使得表现在不同子区域的核磁共振(Magnetic resonance,MR)影像的纹理特征不同,隐藏的与预后有关的危险信息也不同。因此,基于影像组学技术,将肿瘤空间结构分区,进而研究不同子区域的危险特性,是预后分层的关键。为了得到与短生存期患者关联性最大的“高危子区域”,实现患者生存期准确分层。本文分析了来自癌症基因组图谱(The Cancer Genome Atlas,TCGA)的104例GBM患者。首先,在标准化的多参数MR图像上,对104个全肿瘤区域(Gross tumor region,GTR)进行自动的肿瘤异质分割。然后,从每个子区提取影像组学特征,构建示例包。最后,利用训练组和验证组的子区域特征分别建立和验证了多示例学习(Multiple-instance learning,MIL)模型。本文主要工作有:(1)建立多参数肿瘤内部异质性分割模式:不同于传统对整个肿瘤的分割方法,本文着力于研究GBM肿瘤分割模式,以实现根据肿瘤异质空间分布信息差异自动地分割肿瘤影像空间。首先,基于患者在FLAIR、T1(T1-weighted)、T1C(contrast-enhanced)、T2(T2-weighted)四种序列下的标准化多参数MR影像,描绘GTR。然后,由所有GTR体素点的多参数信号强度值构建超级像素矩阵,进行K-means聚类,得到最优的聚类数为3。最后,将属于某个集群的每个体素点映射回单个肿瘤GTR空间中,得到104例患者的294个子区域。分割结果表明,不同GBM患者的分类数目不定,分割的子区域在一定程度上可以表示肿瘤的影像异质性模式。(2)基于多示例学习方法的GBM生存期分层及高危区域预测:本文利用预后作为各个子区域危险程度的评价标准,采用基于SVM的多示例学习方法(Multiple instance learning based support vector machine,mi-SVM),确定GBM中各个子区域的预后特性,定位“高危”区域,进而实现生存分层。本文采用训练集中的200个子区域用于训练子区域级的MIL模型,验证集中的94个子区域用于测试模型。实验显示,a)相较于传统基于GTR的SVM方法,mi-SVM方法对于患者整体生存期(Overall survival,OS)分层可以得到更高的准确性、敏感性和特异性,分别为87.88%(29/33)、85.71%(12/14)和89.47%(17/19)。b)在训练组和验证组中,分析了短期OS患者中预测正确的41个高危亚区。结果显示,定位的高危子区域与非增强区域达到60%的重叠比例,是41个高危子区域的主要组成部分。因此,MIL作为一种数据驱动方法,利用识别的与生存相关的高危子区域进行生存分层的效果更佳。并且定位的高危子区域提示非增强区域对预后分层的影响较大。此外,基于MIL的机器学习方法为这种带有粗粒度标签的弱监督医学图像问题解决提供了一种新的思路和方法。