基于YOLO V2点选汉字验证码识别的研究

来源 :成都理工大学 | 被引量 : 0次 | 上传用户:wffg0907
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
信息安全一直是人们关注的热门话题。验证码作为网站保障用户信息安全的一种手段被广泛的使用,与此同时,验证码技术的发展也促进了破解验证码技术的发展。最近国内出现了一种新的点选汉字验证码技术,需要用户按照提示字符的顺序正确点击图片中的汉字字符才能成功通过验证,在提高用户体验的同时,也增加了破解的难度,目前还没有文章介绍关于此类验证码的识别方法。验证码的演变和破解是一个相互促进的过程,只有不断更新验证码技术,才能及时保障网站的信息安全。本文针对该类验证码的识别做出了研究,取得了较好的效果。由于常见汉字多达三千多个,如果训练网络模型进行传统的端到端的定位并识别,需要的数据集量太大,而且人工去标注每一个汉字也不太可能,本文创新性的将此类验证码的识别过程分为定位和识别两部分,提出了一种结合YOLO系列的目标检测算法加上深度卷积神经网络来识别点选汉字验证码的方法,取得了不错的效果。由于缺少此类验证码的标注样本,本文结合YOLO目标检测算法提出了一种弱监督的学习方法来训练。由于YOLO算法对于小目标物的识别效果较差,对同一类目标物的不同长宽比的泛化能力差,而汉字验证码属于小目标的范畴,并且具有不同的长宽比。本文利用Faster R-CNN的anchor机制和全卷积网络思想对YOLO算法模型进行了改进。通过少量标注图片训练了一个汉字分类器,采用区域推荐算法从图中得到候选框,用该分类器对候选框进行粗标注。粗标注的图像将用于初始化YOLO的卷积网络层,由此提升模型的检测性能。经过实验验证,本文提出的改进方法能使用少量的标注图像结合大量的未标注图像进行训练,并达到大量标注图像训练的模型效果。利用全卷积网络思想改进YOLO的全连接层,提升YOLO的检测速度。通过anchor机制改进YOLO的目标框提取层,使其学习目标框的先验知识,从而学习到更多强特征,以提升模型对于小目标物的检测精度。采用Python语言生成常见的3755类汉字的训练集图片,包括4种字体和几种图像增强操作,保证网络的泛化能力,接着搭建一个深度卷积神经网络来训练这些数据集,取得不错的效果。为了方便展示识别的效果,本文通过Python最终实现了在识别汉字字符后按顺序标出对应汉字的位置,以此给出一个直观的展示效果。
其他文献
<正>利用介质对电磁波能量的强烈吸收造成的阴影来重建地下地质体图像的钻孔电磁波层析成象技术,由于它能取得多方位的信息、具有较高的信噪比和分辨率高等特点,在国内外多个
会议
本文主要介绍国内外干扰素外用制剂在治疗由单纯疱疹病毒、人乳头瘤病毒、水痘-带状疱疹病毒以及皮肤癌等皮肤性疾病的临床应用情况,研究结果显示干扰素在治疗这些皮肤病方面
垂直轴风力机作为目前常用的小型风力机,在高层建筑顶部以及城市楼宇之间得到广泛应用。因而展开其气动性能的研究,对于风力机的气动优化设计,具有十分重要的指导意义。本文
将原来整齐划一的教学目标,改为学生能自主选择的弹性目标,可以更好地促进学生发展。鉴于我国大班额班级授课制的国情,制定弹性化教学目标,需要考虑学生群体共同目标达成与个
通过对我国家庭暴力形成的特点以及原因进行探讨,认为在完善法律的同时,还应该以社区为主导,建立起广泛的社会支持网络,通过社区干预,有效地解决家庭暴力的问题。
随着中国税制的改革,企业避税活动在中国上市公司普遍存在,传统的税收规避理论认为企业避税活动减少企业的税收成本,使企业的非效率投资问题得到缓解。但是随着企业制度的改
在欧洲现代性的框架下,记忆最早被来自法兰西国家内外的法国革命的受害者大规模地用作对抗胜利者历史的策略。那些感到有必要恢复早被尘封的生活面貌的人们无不遭受过由于意
上世纪末,随着科技的飞速发展,社会环境发生了质的变化。视觉传播的立体化、动态化逐渐成为了主流,这种针对传统形态上平面化、静态化的改变,开启了具有多媒体共存、三维立体
我国河流湖泊水华现象日益突出,对人类的生产生活构成了威胁,因此迫切需要建立一种可在线测量浮游藻门类与浓度的方法,以实现浮游藻的日常监测和水华预警的功能。荧光测量法
探索以多媒体技术为基础的新型的教育教学平台成为每个教学工作者面临的重要课题。多媒体教学有着不可比拟的优势,但在多媒体教学实践中又不可避免的会存在一些问题,在教学中合