论文部分内容阅读
随着科技的不断发展,机器人在多个领域中都有了应用,例如:医疗领域、工业领域、教育领域等。尤其在工业领域中,工业机器人对工业零件进行抓取,然后完成在流水线上的工件加工、零件装备等流程。在机器人工作流程中,机器人抓取技术的成熟程度至关重要。机器人的自主抓取大多数是基于视觉技术来控制,但是在复杂环境下,识别定位的效果大大下降,从而降低抓取的效率。所以,提供目标物体精确的坐标是现在急需解决的问题。在本文中,基于优化Mask R-CNN算法从RGB图片中识别出目标物体并得到其掩膜分割出目标区域。然后结合Kinect v2传感器将二维坐标转化到三维空间坐标,完成对物体的定位任务。本文具体工作如下:(1)目标物体识别算法实验比较。首先介绍了在物体识别领域中四种较为常用的卷积神经网络目标检测算法,YOLO、SSD、Faster R-CNN和Mask R-CNN。为了提高识别能力和定位的精度,经过实验选择识别精度最高的Mask RCNN。(2)优化Mask R-CNN网络进行物体识别与分割。首先使用Kinect v2传感器彩色相机采集数据,并对数据集进行预处理。接着在Mask R-CNN算法基础上进行了改进,对主干网络进行模型预处理,融合卷积层和BN层参数,通过预运算的方式提高了主干网络向前推断速度。然后使用辅助网络和Scharr算子相结合,在Loss中加入了边缘损失,通过实验发现改进后的网络完善了掩膜边缘细节上的处理。随后在FCN的基础上,加入了一条自下而上的连接,可以让高层特征也融合底层特征的位置信息,提高了目标识别的准确率。最终,使用优化的Mask R-CNN在不同光照、不同背景下进行识别实验,实验表明,算法不会因为光线的变化导致识别准确率过低,受环境影响较小。(3)基于Kinect v2传感器进行空间定位。首先针对深度图像中出现的噪音和空洞,使用多帧中值滤波和双边滤波结合的方式对图片进行预处理。使用了张正友标定法确定Kinect v2彩色相机的参数,随后使用Kinect v2传感器进行三维坐标计算实验。实验表明,在X、Y轴平面和Z轴方向上定位的平均相对误差都在2%以下,证明了Kinect v2传感器定位的有效性。(4)构建基于优化的Mask R-CNN算法和Kinect v2传感器定位模型的物体识别与定位的实验环境。经过实验得到结果,物体的定位相对误差在2%以内,物体识别率98%,可行性较好。