论文部分内容阅读
签名作为身份确认的一种手段被用于诸多领域,如各类文书、合同、银行票据等。至今为止,围绕自动离线签名验证所展开的研究主要是针对随机和简单模仿两种伪签名展开,尤其是对熟练模仿伪签名的鉴别,还有很多基础理论问题及实际应用问题需要解决。因此开展离线中文签名验证技术研究,具有十分重要的理论意义和实用价值。围绕模式识别的三个基本研究内容:数据获取和预处理、特征提取和选择以及匹配方法,对离线中文签名验证涉及的若干关键技术进行了概括性讨论。结合噪声消除基本理论以及需关注的主要问题,同时根据实际应用中签名图像中横线像素分布的特点,给出了一种签名图像中横线的清除方法。与常见的噪声消除方法相比,所给出的方法不仅能将对签名图像的影响降低到最低程度,而且易于实现。计算的复杂度和分类的正确率一直是特征提取关注的两个主要方面。针对中文签字的分类问题,就如何更好体现签名特征这一问题,论述了使用全局特征组成特征矢量的方法。以此为基础,提出了两种模式聚类方法:基于马氏距离的聚类方法和基于特征标权的核聚类方法。签名分段是签名图像预处理中的一个难点,分段方法的优劣对验证结果的影响极大。在汲取前人在笔划提取方面的成功经验基础之上,同时结合签名验证的特点给出了一种具有较低的时间、空间复杂度,同时具有高鲁棒性的分段方法。此外,还给出了一个行之有效的分段配对和签名相似度计算方法,并在此基础上,给出了模板匹配与RBFNN(Radial-Based Function Neural Network)相结合的离线中文签名验证方法。应用DHMM (Discrete Hidden Markov Model)进行分类的一个关键问题,是矢量量化的优劣。有鉴于此,基于签名各分段的六维特征矢量,按照其物理意义的不同分为两组分别进行矢量量化。另外,还采用了多个码字表征一个矢量的方法。针对这两种矢量量化改进方法,采用了经调整后的DHMM训练算法。同基于网格方法提取观测值序列相比较,所给出的基于分段获得观测值的方法能更有效的反映中文签名的特点。提出了一种融合GA (Genetic Algorithms)与Baum-Welch两者优点的DHMM训练方法。经GA优化后的HMM在统计意义上提高了验证正确率。针对熟练模仿伪签名的验证,必须提取更为细节的特征这一基本需求,同时结合签名边缘的像素分布包含更为丰富的签名特征这一基本事实,给出了一种遍历签名边缘的高效算法。通过定义像素的三种运动方向,并由来时方向确定转向方向,该算法能准确指导像素的遍历,确保了遍历的一次完成,使得遍历的时间复杂度降低到O(n) ,从而高效的完成签名边缘的遍历。在签名边缘遍历的基础上,为更为有效的提取到签名的细节特征,探讨了应用小波分析提取二次特征的方法。基于所给出的两种特征提取方法,在HMM (Hidden Markov Model)和SVM (Support Vector Machine)环境下,对离线中文签名验证进行了比较,结果表明HMM更优。结合一个具代表性的应用需求,设计了一个三级分类器串联融合系统。所构建的系统解决了真实签名样本收集问题。每一级分类器完成一类伪签名的鉴别,并按照由粗糙到精细的顺序排列三级分类器,有效的降低了验证所需的时间。基于真实数据的大批量的测试表明了构建的原型系统能够较好的完成离线自动签名验证任务。通过对离线中文签名验证技术的研究,取得了若干具理论价值和实用价值的成果,为进一步开展实用系统的研究奠定了理论和方法基础。