论文部分内容阅读
近年来随着信息技术的发展,高维数据在科学界以及产业界出现的频率越来越高,特别是计算机视觉、模式识别、航空航天以及生物信息等高新领域。这些数据的高维特性往往会成为我们处理时的障碍,相关的算法面临着复杂度高导致计算结果不是最优的问题。降维是通过将数据由高维约减到低维,以揭示数据本身的内在低维结构。它作为克服“维数灾难”的方法在很多领域中都有着重要的作用。过去的几十年中,已经有很多降维算法被不断的提出来并被广大研究者深入研究,常用的像传统的降维算法PCA以及LDA;流形学习算法LLE、LED、ISOMAP以及LTSA等。早期的降维算法大多依赖数据样本的分类信息。然而随着信息技术的发展,很多时候有标签样本不容易获得,存在着大量的无标签样本。为了充分利用数据样本的信息,基于半监督思想的降维方法应用也越来越广泛。半监督学习作为近年来机器学习领域的研究热点之一,已经从最初的半监督分类和半监督聚类拓展到了半监督回归以及半监督降维等诸多领域。本论文就是基于一些实际应用,研究了部分半监督降维算法,具体如下:LLE算法在流形学习领域是非常经典的一种算法,但是其对于多类样本混合的数据集的降维效果不是很好。(1)作者在基于多流形学习的基础上对LLE进行了改进,并且根据项目需要融合了半监督学习的思想,提出了其半监督版本。(2)标签传播算法(LP)是一种基于图的半监督学习算法,其核心思想是通过保持原始数据间的某些特定结构,将部分有标签样本的标签信息通过某些方法传递给无标签样本,直到全局稳定状态。在基于标签传播算法的基础上,作者结合了局部线性嵌入算法的局部重构的思想,对基于判别信息的局部排列做了改进,提出了其半监督版本,采用流形结构上的重构权重结合部分标签信息已知的样本进行标签传播,利用传播后获得的全体数据软标签信息作为类别信息。并对该改进后的算法以及传统的半监督降维算法进行了实验对比分析。(3)近年来,医学辅助诊断系统一直是一个非常热门的话题,其在辅助诊断上的强大能力得到了医生以及病人的肯定,对医学诊断的发展也起着非常重要的推动作用,同时,病例数据的特殊性,也推动着数据降维,特征选择等一系列数据挖掘工作的研究。在众多的医学辅助诊断系统中,应用最广的当属基于图像的辅助诊断系统以及基于病例输入特征的辅助诊断系统。由于超声图像的强噪声特性,其在基于图像的辅助诊断上仍在探索阶段,但是基于输入特征的辅助诊断效果已经较让人满意。本文就是针对输入病例特征对超声医学图像进行辅助诊断。