论文部分内容阅读
场景分类技术因其在互联网以及智能机器人领域具有广阔的应用前景,吸引了越来越广泛的关注。其中,室内场景分类是实现家庭服务机器人室内场景感知与理解的基础。在算法理论方面,存在类间相似度高,类内差异度大以及多尺度多视角等尚未解决的难题;而在工程应用方面,存在领域知识迁移以及识别精度与实用性等方面的技术瓶颈,无法直接在服务机器人上进行使用。针对上述问题,本文提出了两种基于卷积神经网络可端到端训练的室内场景分类方法,并探索了其在家庭服务机器人领域的工程应用方法,主要工作如下:首先,提出并实现了一种基于类内聚合损失的室内场景分类方法,通过孪生网络的思想能够使模型在优化分类准确率的同时考虑到同类样本间的相似度,从而减小同类场景在高维特征空间上的分布距离。为了量化类内聚合损失对同类场景特征分布的聚合程度,提出平均类内聚合程度评估指标AID(Average Intraclass Distance)。实验结果表明,使用类内聚合损失训练的室内场景分类模型相比传统交叉熵损失,在识别精度上能够提升2个百分点以上,而在平均类内距离评估指标AID上仅为交叉熵损失函数的三分之一,说明本文所提方法能够拉近同类场景图像在高维特征空间上的分布距离,提高模型对同类差异的鲁棒性与泛化能力。其次,提出并实现了一种基于卷积神经网络特性的多尺度室内场景分类方法,通过在卷积神经网络结构上结合不同感受野特征图使模型具备提取场景中不同尺度目标的能力,同时,结合不同分辨率特征图提升模型对场景多尺度的自适应能力。以上改进结构构成了一套可端到端训练的室内场景分类模型。实验结果表明,该方法能够显著提高模型的分类精度,同时结合本文提出的类内聚合损失函数进行训练,能够在MIT-Indoor67室内场景开源数据集上取得88.5%的识别精度,超过目前室内场景分类最优结果1.3个百分点。最后,提出并实现了一种基于云服务平台的室内场景分类方法,该方法通过将本文提出的室内场景分类模型封装成云服务并部署于实验室自主研发的机器人云服务平台上,解决服务机器人本体计算资源较低,无法直接使用基于神经网络等复杂室内场景分类模型的问题。依托实验室自主研发的大智机器人平台在真实家庭场景中进行实验验证。结果显示,本文构建的室内场景分类云服务不仅解决了基于开源数据集训练的模型在真实家庭场景中的领域知识迁移问题,还实现了复杂室内场景分类算法在常规智能硬件平台上的应用,并在本文构建的真实家庭室内场景分类验证集TC4上达到了 94.5%的分类准确率;同时,云服务结果响应周期仅为75毫秒。满足家庭服务机器人对室内场景分类任务的准确性与实时性要求。