基于流水模型二值化的复杂验证码识别研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:w478435139
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文根据目前字符验证码的发展现状,对验证码识别技术进行了研究和探索。详细介绍了验证码识别过程中各个步骤所使用算法,总结了它们的优势与不足,对验证码识别的技术难点进行了分析。   二值化做为识别预处理步骤之一,用于简化和提取字符信息,包括全局阈值法和局部阈值法。准确提取字符是正确识别的基本前提,由于验证码图像的特殊性,其常包含复杂背景信息,使Otsu、Niblack等经典二值化算法得不到预期效果,从而严重影响了识别正确率。基于流水模型的二值化算法属于局部阈值算法,能够从特定图像准确提取前景信息,但需要在处理每张图像时以实验方式确定降水次数,该不足使其无法应用于验证码识别,为获得其二值效果,本文对该算法进行了研究和改进,并成功将其应用于验证码图像二值化,有效的提高了识别正确率。   本文主要工作如下:一、通过引入边界信息和笔画宽度,改变了原有算法的降水方式和单次降水量,使算法在固定降水次数的条件下对不同图像具有自适应性,能够提取到全部字符区域,并几乎不含噪声。产生的弊端是会产生字符缺损的现象。二、为解决字符缺损对识别的影响,本文借鉴Niblack局部阈值法的思想对算法进一步改进,获得了其在字符及附近区域能够准确提取目标信息的优点,从而取得良好的二值化效果和对多种图像的适应性,文中将改进后算法命名为基于流水模型的目标区域阈值法。三、使用Otsu、Niblack和基于流水模型的目标区域阈值法对三种不同类型的验证码进行实验,识别阶段分别选择了Bp神经网络和形状上下文理论进行字符识别,结果证明,与传统二值化算法相比,本文提出算法在两种识别算法下,均表现出更好的适应性和识别正确率。
其他文献
面对当今复杂多变的国际形势,身处错综复杂的利益纷争,我国国防安全面临新的挑战。为此,军队加快了新军事变革的推进速度,国防现代化建设的需求日益迫切,国内军队后勤保障技术的创
随着国民经济保持可持续、健康发展和城市化进程的加快,人口经济不断发展,城市用水需求也不断增加,同时城市污水的排放问题日益受到重视。如何有效地解决城市污水的处理问题,已成
经过多年的发展我国教育已进入了大众化的发展阶段,办学模式的多元化,办学层次的增多,使在校生人数成倍地增加,教学情况越来越复杂,教务管理难度越来越大。然而,教学是学校的中心工
随着网络与日常生活结合的日趋紧密,网络流量规模及类型不断增加,用户需求也不断纷繁复杂,如何满足各类应用QoS需求同时尽可能提高网络资源利用率已逐渐成为网络管理的一个重
Ad Hoc网络是由一组带有无线收发装置的移动终端组成的多跳临时性自治系统。网络中,每个移动终端兼备主机和路由器两种功能,并可以通过无线连接构成任意的网络拓扑。在无线Ad
当前,保护软件知识产权,防止软件信息泄漏越来越受到人们的关注。在软件攻击技术中,逆向工程是主流的软件分析技术,它能够通过逆向分析推理出用户输入与程序路径分支之间的对应关
科学可视化可以将科学数据转换为图像,便于显示复杂数据结构之间的关系。医学可视化是科学可视化在生物医学工程上的重要应用,在临床与医学研究中具有重要意义,而体绘制是医
网络游戏是一个生命力和活力都很强的产业。中国的网络游戏产业在日益繁荣的同时,也面临着产品同质化严重、人才短缺等发展瓶颈。一款游戏想要从激烈的竞争中脱颖而出,就要兼备
增强现实是将计算机生成的虚拟信息与真实世界的场景通过显示技术结合起来,为用户提供丰富的视觉服务和交互环境的一门新技术。与传统的虚拟现实不同,增强现实只是实现对现实
组态软件在工业控制领域快速发展,是因为组态软件包含了一些已经开发完成的,具有通用性的控件。使得工程人员在开发具体项目时可以方便的进行各种组态。而嵌入式组态软件的出现