论文部分内容阅读
随着现代科学技术的不断进步,计算机性能的不断提升和研究者的深入研究,模式识别问题的应用研究已经成效显著。例如,通过人脸识别辨别不同的人物图像,通过不同的表情来区别不同的心情等。在应用研究过程中,字符识别、语音识别、人脸识别已经成为模式识别研究领域中较为突出的几个方面。OCR(Optical CharacterRecognition,光学字符识别)作为模式识别中一个相对古老的研究领域,在模式识别的历史中有重要的地位。为进一步提高在线OCR识别准确率,并同时考虑字符图像中误差噪声和遮挡干扰的存在,利用图像低秩稀疏恢复方法进行图像预去噪和矫正是一种可行的方法。低秩矩阵恢复问题衍生于最近几年非常流行的压缩感知技术,是一种重要的数据分析工具,在计算机视觉、图像处理、推荐系统、文本分析等领域已广泛应用。本文通过对国内外现状的仔细研究,对低秩矩阵恢复问题的现有算法和应用研究进行了全面的分析与总结,指出了现有算法的不足。现有的低秩矩阵恢复方法存在计算量大、能够处理的矩阵规模较小等缺陷,使得该方法在很多情况下不能充分发挥其优势。针对增广拉格朗日乘子法(Augmented Lagrange Multiplier,简称ALM)收敛性的不足,本文提出了基于增广拉格朗日乘子法的一种改进算法:在每步迭代过程中,ALM算法的输出作为一个预测值,新的迭代通过用一些修正步骤来改正这个预测值。虽然已有增广拉格朗日乘子方法提出,但低秩恢复问题算法效率仍然很慢,计算量相当大。本文研究了一种并行分离的增广拉格朗日乘子法,将并行分离的思想与增广拉格朗日乘子法相结合,然后通过一个凸组合步骤形成新的迭代,该算法能在保证收敛性的同时提高算法的计算速度。本文将并行分离增广拉格朗日乘子法用于OCR的字符矫正应用,通过与文献中已经出现的ALM、改进ALM算法比较,表明所提的方法在保持正确收敛的情况下,算法的效率有了很大提升。在当前计算机和便携终端等硬件多CPU和GPU的CUDA平台条件下,应用多核处理,实现并行分离ALM方法显得格外有实际意义和可操作性。