论文部分内容阅读
计算机笔迹鉴别一直是模式识别领域中的难点,经过40多年的研究,目前的鉴别方法虽然很多,但是还没有一种方法可以达到实际应用水平的准确率和可靠度,每一种方法都有各自的优点缺陷和不同的适用范围。如何利用信息融合技术将不同的方法有机的结合起来,形成高效和稳定的笔迹鉴别系统,是笔迹鉴别研究的发展趋势和方向。本文针对中文笔迹的特点,通过多层次多方法的融合获得了基于信息融合的笔迹鉴别系统解决方案,并根据实际应用要求,结合最新的软件开发技术、网络技术和数据库技术开发了笔迹鉴别系统软件。论文主要获得了如下几个方面的研究成果:1.提出了实用的笔迹图像预处理方法。通过图像预处理获得干净的、归一化的字符图片,是笔迹鉴别获得高鉴别准确率的基础。论文深入研究并基本解决了笔迹图像去除点、线等背景噪声以及重度污染笔迹图像的去噪问题,特征字图片的提取与归一化等问题,获得了实用的笔迹图像预处理技术。通过处理数万份笔迹图像的应用,证明了该项技术的可靠性;2.提出了一种基于稳定性频谱特征的笔迹纹理鉴别新方法。该方法利用多个单字符图片随机排列构造纹理的方式,对一份笔迹构造多幅纹理图片,并且引入快速Fourier变换法提取每幅纹理的频谱特征,加以融合后获得稳定性频谱特征及其距离的估计,然后再分类判别。该方法消除了笔迹纹理图片中因为字符内容和排列位置的不同而产生的特征值的随机性波动。实验数据表明,该方法大幅度的提高了大样本笔迹数据库中的鉴别准确率;3.首次建立了笔迹鉴别影响因子分解模型。论文将影响特征距离的因素分为两类:笔迹书写风格的差异(与笔迹书写人相关,简称书写因子)、汉字的字符形状结构差异(与汉字字符相关,简称字符因子)。其中书写因子是笔迹鉴别的基础,而字符因子则是影响鉴别准确率的不利因素。论文利用方差分析方法验证了书写因子与字符因子的显著性,并首次建立了两因子分解模型;4.首次提出了基于文本依存方法的文本独立笔迹鉴别分类器。论文根据两因子分解模型,利用数据挖掘技术获得的新信息,将不利于分类鉴别的字符因子从特征距离中分离出来,首次获得了基于文本依存方法的文本独立分类器,大幅度地简化了分类鉴别的决策过程,显著地提高了单独一种鉴别方法在大样本笔迹数据库中的鉴别准确率;5.提出了多分类器组合的笔迹鉴别方案。为了提高实际应用情况下的笔迹鉴别准确率,利用几种鉴别方法实现多分类器组合,比较理想的解决了实际应用中笔迹鉴别问题;6.首次提出了一种基于特征融合的少量字笔迹鉴别方法。针对少量字笔迹鉴别情况中检材与样本很难有相同字的特点,论文利用数据挖掘信息对文本依存笔迹特征进行加权,获得近似文本独立的特征,然后通过特征融合方式得到文本独立的分类器进行分类鉴别。该方法为少量字的笔迹鉴别提供了一种解决方案;7.设计并开发笔迹鉴别软件系统,并将其成功的应用推广。通过笔迹鉴别理论研究与技术创新,结合最新的软件开发技术,设计并开发了“笔迹图像预处理软件系统”、“网络化笔迹自动识别检索系统”、‘文件检验办公自动化系统”三个与笔迹鉴别有关的软件系统,并在武汉、南京、上海、北京、广州、内蒙、海南、吉林、辽宁、天津等城市成功的进行有偿推广应用,帮助有关部门破获了一大批与笔迹有关的刑事案件,产生了良好的经济效益与社会效益。“网络化笔迹自动识别检索系统”获得了公安部科技成果三等奖。