论文部分内容阅读
红外特征纸币鉴伪是模式识别领域一个具有代表性的研究课题。因为假币的种类层出不穷且其仿真程度越来越高,使得鉴伪难度越来越大。GB16999-2010国家标准提出“以真鉴假”的思想,这种方法是传统“以假鉴假”思想的一次飞跃。而目前国内金融机具行业软件设计通常仍然采用针对某个鉴伪点来判别真假币,没有真正实现“以真鉴假”,使得金融机具的鉴伪能力大大削弱。为了解决假币无法预知这一问题,本文以我国百元面值纸币的红外图像作为算法的研究对象,设计基于半监督学习的随机森林(Random Forest,简称RF)分类模型,即不是真币就是假币,解决了假币无法预知问题。主要的研究内容如下:(1)对常用的纸币红外图像预处理方法进行研究。选恰当的方法对纸币红外图像进行预处理操作,达到提高纸币红外图像质量,便于提取纸币红外特征的目的。(2)深入研究Gabor小波和主成分分析法(PCA)的基本原理,并结合这两种算法有效地提取纸币红外图像上具有辨别能力的红外特征。(3)提出了一种基于半监督学习的随机森林算法。结合半监督学习思想,只采用带有不同种类标签的真币红外特征构建随机森林分类模型,并根据这些真币红外特征确定判别投票率,从而实现纸币红外特征鉴伪算法研究。(4)对纸币识别算法的参数进行优化。本文主要从特征空间维数、候选属性数量、决策树数量三个方面展开研究,得到相对优化的算法参数,提高算法的识别率。通过实验证明,基于半监督学习的随机森林很好的解决了假币无法提前知晓的问题。但值得一说的是,由于算法的其对未知种类的假币识别能力较强,而因其算法的普适性,则对已知假币的鉴别能力相对较弱。