论文部分内容阅读
随着集装箱装卸朝着自动化、智能化和无人化的方向发展,港口对于集装箱吊装作业的要求越来越高。基于机器视觉的智能装卸系统是未来港口装备发展方向,这种装卸系统通常需要利用视觉检测技术处理集装箱识别定位,然而港口经常面临复杂多变的天气和恶劣的海岸环境影响,导致实际集装箱目标所处背景存在大量干扰信息,同时传统视觉目标检测识别算法受限于港口的光照、天气和场景等多种因素的影响,往往给港口集装箱检测识别带来挑战和困难。近年来,视觉检测识别技术迅速发展,本课题以提高集装箱自动立体识别和定位能力为研究目标,对其两项关键技术——基于深度学习的集装箱检测识别技术和基于双目视觉的集装箱立体定位技术进行了理论分析和实验研究。主要工作成果如下:(1)针对集装箱立体识别和定位的研究需求,搭建了集装箱识别与定位系统的试验系统。硬件方面完成了系统的总体设计和视觉系统硬件选型,算法方面给出了利用Faster R-CNN进行集装箱识别和利用双目视觉进行集装箱深度定位的研究思路。(2)基于复杂自然环境背景进行人工采集、扩增和标注,构建并优化了鲁棒性较强的用于对识别模型进行训练和测试的集装箱数据集。由于本文需要使用深度学习模型进行集装箱目标识别,因此必须对模型进行有效的训练以达到最好的识别效果,而集装箱数据集的准确和优化尤为重要。另外本课题还研究和设计了一种基于GrabCut分割算法的图像目标半自动化标注方法,可精确分割目标前景背景来快速制作大规模集装箱数据集。(3)针对港口集装箱装卸过程中出现的尺度变化,复杂背景,光照变化和天气干扰等情况下集装箱快速准确识别的问题,提出了一种改进Faster R-CNN方法。通过减少模型网络参数,增加空间形变对抗网络,强化样本目标前景特征、多尺度训练学习等策略提升网络训练效率和识别性能,并对本文提出的改进模型进行测试与对比试验。实验表明,该方法可以有效识别集装箱目标以及获得其二维位置信息。(4)针对集装箱的高精度立体定位问题,通过对三维视觉测距技术分析,采用了一种基于双目视觉的测量和定位方法。通过对双目摄像头的标定和校正后进行立体匹配,并设计基于金字塔立体匹配网络计算匹配代价,降低匹配错误率,从而获取更高精度视差图。最后计算深度信息,获取集装箱的三维坐标,并通过实验验证不同条件下集装箱识别定位算法的准确性。