论文部分内容阅读
笔迹鉴别是根据手写笔迹的风格对书写人身份进行判定的一门科学与技术。笔迹的获取具有非侵犯性,易为人所接受,目前笔迹在司法、金融、考古、公安等领域中被广泛的用来鉴定人的身份。作为一种生物识别技术,目前的笔迹鉴别已经成为众多研究者关注的一个研究热点。在实际应用中我们通常得到的是大量的无标号样本和很少量的标号样本。传统的监督学习需要大量的标号样本,而无监督的学习方法仅仅使用无标号样本,而浪费了标号样本。因此,半监督学习即从有标号样本和无标号样本中学习,成为了机器学习领域中的一个新的研究热点。如今的半监督学习已经从最初的半监督分类和半监督聚类,扩展到了半监督回归和半监督降维。相对于其它三个半监督学习算法,半监督降维的研究还比较少。本文主要研究笔迹鉴别中的半监督降维算法,主要工作如下:首先,对采集得到的笔迹图片进行预处理得到归一化的笔迹纹理图片,本文采用的是基于纹理分析的方法,使用改进的多通道Gabor小波提取笔迹的纹理特征,本文的Gabor核函数取40个通道,对于每一通道的Gabor滤波图像都提取其均值和方差作为最后的特征,这样每一幅笔迹图片得到一个由80个特征组成的特征向量作为最后的笔迹特征。其次,分析比较现有的半监督降维算法的优缺点,结合笔迹鉴别数据的特点,本文提出了适用于笔迹鉴别的基于测地线距离的半监督局部维数约减算法(GSLDR),该算法用测地线距离代替了不能反映数据流形结构的欧式距离,对成对约束信息进行了扩充,提高了约束信息对降维的指导作用,并且将约束信息加入到近邻图中,使得近邻图能够更为真实的反映数据的流形结构。最后,在Matlab环境下进行实验,采集15个人每个人10幅共150幅笔迹作为实验样本,取每个人5幅共75幅笔迹图像作为训练样本,剩下的作为测试样本,用本文的算法和其它半监督降维算法对实验样本进行维数约减,最后使用最近邻分类器进行分类,实验结果验证了本文的半监督降维算法在笔迹鉴别中的有效性。