论文部分内容阅读
随着近几年来科学技术的高速发展,人类已不满足于工业时代的让机器代替人力的简单需求,而是希望让机器拥有类似人类的大脑来代替我们处理复杂的生活中的问题,人工智能应运而生。传统的导航系统多是基于卫星导航实现的,但无法实现室内的定位导航多是由于室内环境复杂,信号到达地面变弱而导致无法穿透墙体造成的。常见的室内导航定位手段有Wi-Fi、蓝牙、红外线、超宽带、RFID、ZigBee和超声波定位等等,本文主要的方法是基于改进的卷积神经网络的单目视觉室内定位,该方法是针对传统方法造价高、抗干扰能力差,鲁棒性弱、兼容性不好等问题而提出的智能化的辅助定位手段,传统的计算机视觉相机姿态估计方法受图像中复杂背景的影响在提取特征角点时,受到非感兴趣角点的影响非常严重,所以本文加入了改进的卷积神经网络算法在复杂室内场景中加入了区域限定,在感兴趣区域内完成相机姿态估计更好的实现了实现低成本、高精度和更稳定的导航服务。本课题的主要内容有以下两个方面:(1)对传统的卷积神经网络进行改进,实现端到端的模型训练与测试,完成室内单目标记物的识别与分类。传统的目标识别方法很难在复杂的室内场景下识别并抓取单目标记物的图像区域,而卷积神经网络能够从大量的样本数据中来学习到图像中深层次、抽象化的特征,在图像的识别和分类领域表现出显著的优势。本文对传统的卷积神经网络加以改进以实现分类与检测的整合,主要包括:不同尺度特征检测,多特征融合,端到端的整合。使得模型既提高了检测精度,同时又提高了检测速度,实现了图像中感兴趣区域的识别与抓取。针对pascal VOC数据集的测试精度为73.1%,针对本文任务的数据集精度为98.3%,测试速度53帧。(2)在上述工作完成之后采用轮廓逼近法以及Harris角点检测等方法,将单目标记物角点抓取,确定其在图像中的位置,然后将相机的姿态估计问题转化为PNP方程组求解问题,并对传统的RPnP、EPnP和CEPPnP算法进行对比分析,寻求最优的相机姿态估计算法对当前拍摄位置的世界坐标进行定位,实验结果表明本文提出的定位算法具有较高的稳定性,单张图像检测定位精度误差在xyz三个方向不超过0.01m,视频流30帧的情况下三个方向误差不超高0.08m,达到了室内定位的精度要求。