论文部分内容阅读
手写连续数字串识别在现实生活中应用广泛,如邮政编码、统计报表、银行票据、学生成绩等。同时在光学字符识别研究领域中,属于较为困难的课题之一,该课题最大的难点在于数字之间出现的粘连、断笔、重叠等现象,同时由于数字没有上下文语义逻辑关系,且经常会涉及到金融、财务领域,所以在实际应用中,对于数字识别准确率的要求非常高,因此其重要性和严格性不言而喻。目前的对于该领域的研究主要集中在手写连续数字串分割和神经网络识别优化方面。首先,对于数字串分割,目前的分割方法集中在利用对数字结构分析获得的规律进行分割,但这些算法的复杂度高,速度较慢,分割准确率却不高。其次,对于神经网络识别优化,目前的优化方法更多关注在神经网络结构优化和神经网络参数优化上,但没有关注训练过程中,每个网络参数的变化和调节,并且没有提出针对手写连续数字串这一特定样本的神经网络优化方案。为解决以上手写连续数字串识别的难点问题,提高识别率,对手写连续数字串识别的研究工作包括以下几方面:连续手写数字串分割:数字串分割是整个神经网络识别过程的基础,有效地进行数字分割会为提高特征提取质量和神经网络识别有很大影响。研究中利用了贮水池原理,识别出数字串由粘连而构成的贮水池,通过对贮水池、数字串质心、闭环等结构特征的分析和计算,提出基于贮水池特征的分割方法。该方法与其他分割算法相比,不仅提高了分割速度,并且分割准确率得到了相应的提升。提取最优特征集:为降低神经网络输入量,同时减少冗余输入和噪音,需要对手写数字样本提取特征作为输入向量。分别对傅里叶系数特征、笔划密度特征、轮廓特征、投影特征、重心及重心矩特征、粗网格特征和首个黑点位置特征进行研究和比较;利用单个特征优劣法筛选优秀特征,构成最优特征集。优化BP神经网络激励函数算法:提出一种新的算法,更新BP神经网络在训练时的激励函数参数,通过引入自适应的增益更新算法,同时对于在训练过程中出现的学习“平坦区”进行了有效地解决,在传统BP算法的简洁优势基础上使其参数自动调节,加快网络的收敛速度。该算法使整个神经网络可以不断地、灵活地、自主地调节,提高了其学习和识别效果。同时与其他相关优化算法比较和分析后,本方法不仅在识别率上有所提高,在识别速度和内存消耗上也具有优势,取得了较好的效果。