论文部分内容阅读
验证码是现在常用的安全技术之一,基于文本的验证码应用最为广泛,这类验证码要求用户输入验证码图像中显示的文本来达到验证用户的目的。通过验证码设计的现状,可知基于文本模式的验证码的安全性主要依赖于验证码图像中字符的粘连程度。验证码被分割成独立字符后,能够用常规的方法(例如神经网络)对其进行识别,且成功率高。由此可见,提出可行的字符分割算法在验证码识别尤其重要,从而突破验证码识别的瓶颈。在本课题中,首先应用自组织映射神经网络来识别一种非粘连验证码,能够以较少的训练样本和训练时间取得令人满意的学习效果,与使用其他方法对同类型验证码的识别相比,具有识别率高,训练样本少,训练时间短等特点;再者,描述了多种对Web QQ验证码进行分割的算法,该类验证码是一种粘连验证码。使用骨架提取算法这种非常规法来去除或者削弱验证码中的干扰弧。提出了基于骨架提取的字符分割算法、基于字符轮廓修复的字符分割算法,给出了这两种不同算法处理的结果,并对这两种算法的优点和弊端进行了分析。再将分割成的独立字符送入自组织映射神经网络训练或识别,给出了验证码识别的系统框架和两个子模块设计,介绍了实验中应用的第三方库。接着给出了上述两种验证码识别实验对应的实验结果及其分析。通过实验,非粘连验证码的识别率为100%;粘连验证码的识别率约为80%。本课题中所提出的算法对粘连验证码的攻击和强验证码的开发都能够有所帮助。最后,展望本课题未来的工作和验证码今后的发展趋势。