基于图像处理和卷积神经网络的文本验证码识别技术研究

来源 :东南大学 | 被引量 : 0次 | 上传用户:kdkd03
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的飞速发展,各种网络空间安全问题也日益突出。验证码技术是经常用于维护互联网中人机交互安全的重要手段之一,它能通过简单的图灵测试区分当前用户为人类用户或计算机模拟的虚拟用户。文本验证码是应用最为广泛的验证码技术之一,广泛应用于网站登录等需要安全保障的环节。对文本验证码识别技术的研究是网络空间安全领域的研究热点之一。目前国内外研究者已经提出了多种验证码识别方法,但是这些方法都存在实验数据集庞大或分类模型复杂等问题,一般需要人工参与前期工作,此外这些方法一般是针对特定类型的验证码,不具有通用性,尤其是针对字符粘连、扭曲、变形等特殊情况识别效果难以令人满意。针对以上问题,本文基于图像分类和计算机视觉技术,重点研究了存在字符粘连、扭曲、变形等反分割处理的文本验证码。本文的主要工作和创新点包括如下几个方面:(1)基于数字图像处理对文本验证码图片进行预处理和字符分割。在字符分割阶段,加入了预分割操作,根据每张验证码图片的实际特性,利用投影分析、颜色填充算法、以及字符宽度等进行预分割,判断使用连通域分割或者滴水算法分割。连通域分割主要提取颜色填充算法所得单个连通域或其组合为独立字符。滴水算法分割则是将水滴轨迹作为分割曲线,滴水算法起始点由预分割阶段决定,同时针对文本验证码图片的特性对滴水算法做出适当修改,该方法不会沿着水平方向错误分割字符。此外,在字符分割阶段,会根据实际情况调整滴水算法起始点,重新进行算法,以保证提取出的字符足够独立,并且完整度较好。(2)构建了一个卷积神经网络对独立字符进行训练和识别。本文针对字符特征,设计了一个卷积神经网络,同时还引入了中心损失,可用于最小化类内差异,而传统采用卷积神经网络的文本验证码识别方案中使用的损失函数并不包含中心损失,只能最大化类间差异,两者相结合,能进一步提高识别准确率。(3)以Tensor Flow框架构建卷积神经网络,基于真实数据集搭建了文本验证码识别系统并进行了较为全面的实验。实验结果表明,本文提出的字符分割方法在实验数据集上可以获得超过98.5%的字符分割成功率,此外引入了中心损失的卷积神经网络也能在字符识别阶段表现出更好的性能,最终在实验数据集上能取得56.29%~99.57%的识别准确率。
其他文献
公钥基础设施(Public Key Infrastructure,PKI)经过近三十年的发展,已经成为了计算机领域内建立信任关系的基石,能够在不可信的网络环境中,提供低成本的信任建立计算范式。但是从严格的安全视角来看,公钥基础设施依旧存在着许多问题,比如证书颁发机构权力过大、证书与查询不关联、信任模型复杂等。近些年来,学术界和工业界为了解决这些问题,提出了各种各样的解决方案,其中提高证书操作的透明
混合型产品装配线能够在同一条装配线上混合生产结构相似、工艺相近的不同类型产品,可以满足消费者对于产品多样性的需求,因而在汽车行业得到了广泛应用。在实际生产中,由于混装线上不同生产部门对于生产序列的偏好不同,常常需要通过主动重排序对上游产品序列进行调整以满足下游车间需求。另外,生产中的意外扰动因素也会导致产品偏离其在计划序列中的位置,因而有必要通过被动序列调整将被打乱的序列复原,以减少初始生产计划的
随着社会信息化程度的加深,加密系统的规模也不断扩大,传统的密钥管理方法的缺陷正日益凸显。因此,作为一种安全高效的密钥管理方法,密钥分享(Secret Sharing)受到了越来越多的关注。密钥分享是指在一些参与者中分享一个密钥信息,使得某些特定的用户集合可以恢复出此信息,而其他的用户集合无法得到关于此密钥的任何信息。本文重点研究用户具有不同存储能力前提下的密钥分享问题。本文首先提出了一种加入共同信
互联网Client/Server架构的交互模式设计是网络体系结构的基础,可以支持开放的网络服务,这样的体系结构使得服务器成为互联网中的核心资源,因此及时掌握网络中的服务信息对于网络安全防护和信息收集具有重要的意义。收集并定位互联网上的服务是一项传统的工程。常规的服务发现均由发现和定位两个环节构成,其中发现环节一般采用探测整个IP空间的方法实现,对资源的消耗较大;而定位环节则是基于主动探测实现,该方
云存储技术的发展让人们看到了这一领域广阔的应用前景。用户将数据转移到云平台上能够享受大容量的云存储资源和多种多样的云计算服务,但是同时也因为用户对云中数据可控性降低带来了新的安全隐患。为了保护隐私数据的安全性,用户可以将自己的数据进行加密。可搜索加密技术可以直接对密文形态下的数据进行搜索操作,为目前云存储系统下数据安全保护提供了解决方案。针对目前可搜索加密方案存在的一些问题,在缺乏信任的云存储环境
近年来,消费者在利用移动智能终端进行日常工作和生活娱乐等活动的同时,也面临着个人隐私泄露的安全风险。作为市场占有率最高的移动操作系统,Android系统所受到的恶意攻击和安全威胁也最为剧烈。一些Android应用向用户索取的系统权限远大于其实现功能所必须的权限范围,而这种对权限机制的滥用不仅仅来自攻击者开发的恶意程序,也来自合法厂商开发的所谓良性程序,因而无法通过已有的恶意应用检测方法来解决这一问
快速城市化带来的诸如空气污染、热岛效应、疾病传播等生态环境问题,已经严重影响到人类的生存环境和身心健康。在此背景下,本文基于健康城市的理念和价值原则,以城市风环境要素为研究抓手,通过大数据分析,运用相关的城市设计方法,落位街区规划,切实改善城市物理空间环境的品质。论文共分六章。首先,文章基于健康城市理念和中国长三角地区的风环境条件,从安全性、舒适度、污染物扩散和热岛效应缓解等方面,确定了“平均风速
随着量子计算机的出现,基于计算复杂度的公钥密码体制下的保密通信,其安全性受到挑战。基于传统对称密钥加密的保密通信,又存在预共享密钥的存储、分发问题。而无线信道由于具有互易性,因此可将无线信道特征作为对称密钥生成的随机源,在避免密钥分发问题的同时,提供“一次一密”的安全通信,因而成为了研究热点。基于无线信道特征的的保密通信方案主要由物理层密钥生成(PKG)与保密通信两部分构成,本文主要研究PKG中的
无线通信已经在日常生活中发挥着越来越重要的作用,保障无线通信网络的安全具有重要意义。无线通信由于其开放性、脆弱性、拓扑性,极易遭受攻击,目前传统安全机制在无线通信网络安全方面发挥着重要作用。但是传统安全机制拥有明显的局限性:不适用于低功耗的网络节点设备、或被量子计算攻破、密钥分发困难。无线通信物理层安全研究为无线通信安全提供了一个新的角度,在无线通信中,通信双方的信道具有良好的短时互易性,因此可以
复杂网络拓扑结构可视化是基于图布局算法来展现拓扑结构并帮助使用者更加直观获取有价值信息的一种数据可视化技术,并且成为展示网络拓扑结构可视化的主要技术。但是,许多复杂网络拓扑结构可视化主要把关注点放在技术的实现上,忽略了用户的认知层面,导致可视化存在着许多不满足用户认知的一些视觉特征,例如连边交叉、节点重叠等,它们使得网络的拓扑结构无法很好被用户理解。因此,本篇论文从认知角度出发,对可视化进行评估和