论文部分内容阅读
特征选择方法是模式识别中的一个重要组成部分,它的作用在于增强识别的效应和发现医学影像分析中潜在的生物学标记。然而分析磁共振这种典型的高维小样本数据(而且特征间相关较强,大量特征冗余),传统的多变量分析方法在较多时候得到的都是一些不稳定和不可靠的结果。为了提高发现的生物标记物的可解释性和之后的分类器的可靠性,本文对磁共振数据的特征选择方法进行研究:通过对磁共振数据的特点分析,找到一种结合稳定选择方法和弹性网结合的特征选择方法,并利用仿真实验证明其相比于传统的多变量方法具有明显的鲁棒性优势;通过对多中心注意力缺失症病人(attention deficit/hyperactivity disorder,ADHD)的分析,发现了这种方法对于多中心网络数据也具有优势;通过对面孔识别的数据分析,发现此方法对于结构数据的有效性。主要工作如下:1通过对磁共振数据特点的分析,提出了一种结合稳定选择方法(stability selection,SS)和弹性网(Elastic net,EN)的特征选择方法(SS-EN)。通过对仿真数据的实验,我们发现,该方法相较于传统的多变量方法,在较强的噪声干扰下,依然能得到较好的结果,即该方法具有很强的鲁棒性。2通过对多中心ADHD数据建立诊断模型,寻找其客观的生物标记物并进行了分类。结果证实了SS-EN算法对真实功能磁共振数据的有效性,不仅得到的生物标记物有明显的生理学意义,而且算法得到的特征用于分类也能得到比其他方法更好的结果。3通过对面孔识别数据进行处理,寻找其脑激活区域。我们的研究证实了SS-EN算法对于检测认知任务的关键区域的有效性,并通过与其他方法的对比,发现了SS-EN算法能够检测到空间连续性更好的区域。