论文部分内容阅读
随着机器视觉技术的不断发展,其在工业领域上的应用越来越多。汽车生产过程中,车门限位器安装之后需要确认其型号是否正确,而现阶段都是通过人眼观察来判断零件型号,长时间的工作下不可避免地造成了正确率的下降。为解决此问题,本文对机器视觉在车门限位器检测和识别中的应用进行了相关研究。本文框架分为四大部分:(1)针对车门限位器零件上的螺母,利用自适应增强(Adaptive Boosting,Adaboost)框架对螺母进行精准定位。利用螺母的局部二值模式(Local Binary Patterns,LBP)特征训练多个二叉树弱分类器,将所有弱分类器组合成强分类器,利用强分类器对螺母进行定位与识别。(2)对车门限位器零件上字符进行定位与分割。因为车门限位器上的字符为下凹字符,由于对光线反射的不均匀,现有方法较难对其准确定位,所以本文针对这种字符,先采用强光源对字符进行前向打照,以突出字符的边缘,再采用改进方法对字符进行定位与分割。在定位与分割之前,利用基于先验知识的改进Canny算法提取字符边缘。定位与分割时,分别使用两种方法:基于边缘的字符定位与分割、基于最大极值稳定区域(Maximally Stable Extremal Regions,MSER)的字符定位与分割。第一种方法根据字符的边缘疏密度对字符进行精准定位,然后利用垂直投影与连通域的方法对字符进行分割;第二种方法利用最大极值稳定区域方法在零件的边缘增强图上定位字符,然后利用连通域的方法分割字符。实验证明,基于边缘的字符定位与分割方法在准确率上优于基于最大极值稳定区域的字符定位与分割方法,但在速率上不及基于最大极值稳定区域的字符定位与分割方法;(3)对零件上字符进行识别。采用三种方法对其进行识别:基于多模板匹配的字符识别、基于卷积神经网络的单字符识别和基于Faster-RCNN的端到端字符识别。第一种方法先通过监督学习的方法制作模板库,再利用基于有界部分相关(Bounded Partial Correlation,BPC)思想的高效算法对模板匹配进行加速。第二种方法搭建了一个七层简易网络模型:“卷积-池化-卷积-Dropout-池化-卷积-全连接”,利用前六层进行特征提取,最后一层实现字符分类。第三种方法跳过了字符定位阶段,实现了端到端的字符识别。实验证明,第一种方法的识别准确率最低,第三种方法的识别准确率最高。