论文部分内容阅读
21世纪初期,互联网获得了极大的发展,多种多样的网络服务让人们的生活更加丰富和方便。伴随而来的网络安全问题也越来越受到服务厂商和人们的关注。验证码技术作为网络安全中最常见的基本手段之一,得到了广泛的应用和发展,许多科学工作者对它进行了深入研究。验证码识别技术是它的一个研究方向,能够分析和发现验证码系统的现有缺陷,提高验证码设计的安全性。验证码识别技术是在数字图像处理理论和模式识别理论基础上的综合研究与应用,本文主要研究了基于模板匹配方式的验证码识别技术。文中详细介绍了验证码识别中各个阶段的技术方法和理论,主要包括:图片预处理阶段、图像字符分割阶段和字符的匹配识别阶段。针对各阶段的方法综合设计了完整的识别方案,在验证码的识别实验中取得了很好的效果。首先针对图片预处理中需要使用的数字图像处理技术展开了深入的分析和研究,重点阐述的是图像灰度化、二值化处理、图像噪声消除以及验证码中的图像干扰线去除等过程的理论和常用的技术手段。针对曲线型干扰线问题,设计了一种相应的解决方法,并获得了较好的效果。其次,介绍了图片字符分割的多种方法和理论,并针对每种算法设计了实现的步骤,分析了各种方法的优缺点和适用场景。本文对连通区域检测算法提出了改进方法,很好的适应的轻度粘连的字符分割场景。同时在结合连通区检测和投影方法优势的基础上,通过加入过度分割的后处理策略设计了一种基于连通区检测和投影的分割方式,对于字符预处理后存在像素损失的场景有较好的适应能力。最后,分析和研究了字符特征建模的三种方法和理论,阐述了各自的适应场景和优势。对于特征建模,本文提出了基于边缘信息的轮廓走势特征,对字符的旋转和形变有良好的适应性。本文用Java语言编写了识别的所有流程,并通过实验分析证明了本文中设计的识别策略和方法能够取得很好的识别结果,与此同时本文提出的特征模型具有很好的字符描述能力。