论文部分内容阅读
文字识别主要包括文字信息的分析处理,文字特征的提取和文字的识别判断。其主要应用在阅读,信息录入及办公自动化等领域。当前的文字识别技术主要有模板匹配方法、基于字符特征的方法及基于神经网络的方法等,或者是几者的相互结合。文字识别技术的核心是特征提取,优秀的特征提取算法决定着文字识别的速度和识别的正确率。通常主要用结构特征和统计特征来区分字符特征,结构特征主要是体现字符结构构成的骨架特征、轮廓特征和方向线素特征等;统计特征主要包括网格特征、外围特征及复杂指数特征等。但是由于污染和相似字形的存在,这些因素给文字识别带来了一定的难度,这推动了文字识别技术的不断发展。神经网络自诞生以来,一直不断向前发展,其处理问题的能力不断提高,涉及的科学领域越来越广,被广泛的应用到很多领域。径向基函数神经网络是一种由隐层和输出层构成的前向型神经网络,由于其学习收敛速度快的优点而受到重视。它具有自学习、自组织及自适应等功能,可以并行高速处理数据。实验表明该网络具有良好的逼近任意非线性函数的能力,在文字识别研究中具有良好的应用前景,可以利用其极快的学习收敛速度,最佳逼近的特性来提高识别的速度和准确度。本课题对文字识别的相关技术及神经网络技术进行了研究和分析,对应用比较广泛的字符特征提取算法进行了比较和分析,提出了改进的复杂指数特征提取算法,将研究内容应用在一个基于神经网络的文字识别系统。该系统采用改进的复杂指数特征提取算法采集文字特征向量,对特殊字符和相近字符进行特殊处理。该系统采用用硬件实现的神经网络,对神经网络进行了优化设计。通过大量的文字样本训练之后,提取识别文本对象的特征向量作为该系统的输入,从而实现对文字的识别。