论文部分内容阅读
验证码是一种区分用户是计算机还是人的公共全自动程序.为了尽可能大批量地获取某网站的信息,就需要让机器可以全自动地识别该网站的验证码.为了破解验证码,对深度学习的验证码图像识别方法进行了研究.提出使用图像标注的方法来生成验证码图像中的字母序列.实验采用深度学习框架Caffe,将卷积神经网络与循环神经网络相结合进行训练.将卷积神经网络的输出用于训练循环神经网络,来不断地预测出序列中下一个最有可能出现的字母.训练的目标是将输出的词尽量和预期的词一致.测试结果表明,该模型能够对该网站的验证码图像做到97%的识别准