论文部分内容阅读
流形学习作为一种非线性方法在探索高维复杂数据的内在规律等方面取得了令人瞩目的成果,是近年来机器学习领域的研究热点。现有的流形学习方法如等距映射Isomap、局部线性嵌入LLE、拉普拉斯映射LE、局部切空间排列LTSA等,都是基于重构误差最小等原则进行降维的,对识别和分类而言并不是最优的;同时,这些方法难以解决小样本、噪声、形变以及短路等鲁棒性问题。围绕这些问题,本文开展了如下研究工作:1)提出一种改进的ISOMAP算法(KIMD-ISOMAP)进行降维。用基于邻域的图像欧氏距离寻找最近邻,并用直接线性判别分析方法(Direct LDA)取代多维尺度分析法,以提高ISOMAP算法的分类能力。该算法在一定程度上提高了对噪声和几何形变的鲁棒性,有效地扩展了邻域半径的选取范围。2)提出一种基于局部和全局Fisher判别的线性切空间排序算法(LDA-LLTSA)。该算法结合LLTSA和LDA的优点,在实现局部几何结构保持的同时,又能充分利用数据的类别信息,得到全局投影矩阵;在局部切空间内加入类别信息,最终得到全局最优的投影矩阵,实现降维和分类的结合。3)提出一种基于邻域集合关系的近邻寻找方法AHNT,以寻找安全的近邻范围和最优的近邻参数。该方法通过逐渐扩大稳定的小邻域以期获得较大的安全的大范围邻域,实现邻域的自由选择,有效的解决了流形谱方法中存在的短路、溢出、高维严重形变和近邻范围有限等问题。4)探索用流形特征来描述台风云图序列,给出一种能够很好的对台风云图进行跟踪和预测的流形学习算法。根据台风的流形渐变特征以及低维的结构保持特征,提出一种序列图像数据的低维相似性匹配方法,以期根据台风序列云图特征,探索出一种基于历史数据的台风预测模型。