论文部分内容阅读
场景分析(Scene Understanding)一直以来都是计算机视觉领域的一个重要问题,它指的是对三维点云数据的处理,包括语义分割、模型重建等。所谓三维点云数据指的是只包含空间坐标(x,y,z)信息的数据,场景分析就是对这些原始的数据进行处理,运用一定的数学方法,为这些原始数据赋予人类认知上的含义和意义,最终帮助机器理解世界,并为机器的自动化服务。有效的场景分析能够为计算机视觉在生活上的应用提供大量的帮助,例如机器对物体的自动识别、机器自动驾驶、真实场景的建模等,因此对三维点云场景数据的语义分割建模研究具有重要的意义。随着三维传感器的性能不断提高,三维点云数据的获取变得越来越容易,而且精度也越来越高。一般的三维传感器有雷达传感器、立体视觉传感器(stereo)、SFM (Structure From Motion)系统,由于雷达传感器获取数据的速度比其他传感器更快,精度更高,这意味着我们可获得的数据变得更大量,并且更有效。那么研究如何自动化地处理这些大量的数据,并且赋予这些数据真实的语义,理解这些数据就变得更越来越迫切。本文将着重研究对如此大规模的三维点云数据的语义分割,包括分割、特征提取、分类识别和优化。本文还研究了基于语义分割后的树木和房屋的三维建模,并分析了场景在三维处理软件Maya和当前热门的游戏制作软件Unity中的渲染。本文提出了一个基于双重尺度分割(dual-scale analysis)的语义分割解决方案。双重尺度分割指小尺度上的聚类(Cluster)和大尺度上的分组(group),分割有利于区别场景中不同尺度的物体(例如邮箱和房屋),并且大大减少处理数据量,提升处理的速度。双重分割后我们在分割的基础上提取基本的几何位置特征,并进行分类识别。在有效地分割后,即使一些简单的几何特征也能够有效地识别不同的物体。在用分类器识别出物体后,我们还使用Graph Cuts来对识别结果进行有效地优化,最终得到有效语义分割的场景。