论文部分内容阅读
视觉对于人类来说是获取信息的重要渠道,对于服务机器人来说亦是如此。通过视觉感知环境信息是服务机器人与使用者友好交互的关键技术,而其中的物体检测、目标跟踪是实现服务机器人智能化的关键环节。近些年,物体检测与跟踪技术已经成为机器人相关领域的重要课题。当面对复杂环境时,人类可以很快的筛选出重要的信息,并凭借此部分信息快速做出反应。但是,对于机器人来说,目前依然不能够在大规模的数据下进行快速且准确地物体检测与跟踪。因此如何改善机器人提取信息的机制对提升物体检测与跟踪的准确性及实时性有着重要的意义。本论文利用强化学习的推理策略提取信息,研究基于马尔可夫决策过程(MDP)模型的物体检测与跟踪技术,主要内容包括:(1)针对机器人在家庭环境下的物体检测的候选区域提取问题进行了研究,提出了一种基于动作注意策略的Tree-DDQN物体检测候选区域提取的方法,通过执行改变检测框的动作以使物体逐渐集中在检测框内。该方法将Double DQN(DDQN)的方法与树结构的方法相结合,首先通过DDQN方法在执行较少的动作下选择出当前状态的最佳动作,获取符合条件的候选区域。再根据执行所选择动作之后所得到的状态重复执行上述过程,以此形成树结构的多条“最佳”路径。最后采用非极大值抑制的方法从多个符合条件的候选区域选择出最佳候选区域。实验结果表明,多数情况下该方法较其他方法都有着更好的检测性能,可以较好地实现物体检测。(2)针对多目标跟踪稳定性问题进行了研究,提出一种基于角点增强的MDP动态目标跟踪方法。该文采用MDP模型的目标跟踪方法,将多目标跟踪问题转换成基于MDP模型的策略问题,一个MDP模型代表着一个目标的生命周期,多个目标由多个MDP模型表示。跟踪过程中采用Shi-Tomasi角点法产生的强角点来替代传统TLD算法中等间距产生的特征点,使目标特征点在被跟踪的过程中更加稳定。数据关联的相似性函数的学习等价于MDP策略的学习,采用的是强化学习方法。实验结果表明,基于角点增强的MDP模型目标跟踪算法有着较好的跟踪性能以及一定的抗干扰能力。(3)为了能够对前面提到的物体检测与目标跟踪方法进行更好的研究与分析,设计并实现了基于MDP模型的物体检测与跟踪系统。软件系统分为物体检测和目标跟踪两个部分,每个部分又分别从训练阶段和测试阶段进行设计实现。在公共数据集及利用Turtlebot机器人实际采集的数据上进行了实验,实验结果验证了算法的有效性以及系统的鲁棒性。基于以上内容,实现服务机器人在家庭环境下对物体的检测以及对人运动轨迹的跟踪,提高机器人的视觉感知能力,以便更好地服务人类。