论文部分内容阅读
图像目标识别是计算机视觉的核心问题之一,而视觉特征提取是决定图像目标识别水平的关键。本文以国家自然科学基金重大研究计划“视听觉信息的认知计算”支持的重点项目“高速公路车辆智能驾驶中的关键科学问题研究”和国防973项目“水面***基础研究”为课题研究背景。围绕图像目标识别的中层特征学习与表示方法展开研究,提出有效的视觉特征学习算法提高了图像目标检测与识别的性能和无人驾驶车辆的视觉环境感知能力。论文的主要成果和创新点如下: (1)提出了基于层次化自动编码网络的神经元通道特征提取算法。该算法从图像通道的局部信息压缩方式入手,利用层次化的自动编码神经网络实现低维通道特征的提取。神经元通道特征是以类别相关的数据驱动方式完成提取,相比已有的通道特征更加具备数据的自适应性和图像外观描述能力。 (2)提出了结合神经元通道特征和分块集成决策树的目标检测方法。该方法强调对不同属性的通道特征分块进行特征选择,并设计了一种自适应的集成决策树算法建立强分类器来实现有效的目标检测。该检测方法在行人和路标检测等国际公开数据库中均取得了优异的性能,并在本文建立的大规模中国路标检测数据库中达到95%检测准确率,应用于无人驾驶汽车的视觉环境感知系统。 (3)提出了一种基于组稀疏化正则的图构建算法。该算法强调利用组稀疏化的正则项约束图的邻接关系,使得在构图过程中同时考虑稀疏性和局部性约束,进而改善图结构的类内关联性和类间区分度。同时,我们给出了组稀疏化图构建的快速求解算法、核扩展方案以及基于组稀疏化图的流形特征学习算法。相关流形算法在不同的图像聚类和分类数据库测试中进行了验证分析,验证结果均表明了算法的有效性,同时算法应用到环境感知中的路标识别任务中,实现了准确的多类交通路标识别。 (4)提出了一种分解后提取的中层特征学习和目标识别框架。该框架强调对图像结构-纹理成分的分而治之,利用分解的机制产生多种图像成分空间然后实现属性相关的特征提取与合并。在框架中,我们给出了一种分层的图像结构-纹理分解方法和属性相关的中层特征提取的方案。同时,我们进一步指出提出多层次图像分解可以理解为内尺度空间的产生过程,从而表明提出的框架是一种广义尺度空间的中层特征提取新思路。算法在多个国际公开数据测试库中均得到了更好的识别率,验证了该特征提取框架的有效性。最后,针对海面船只识别这一实际任务提出了框架的简化方案,实现了有效的海面船只识别方法对检测目标属性进行判别,海上验收识别正确率达到90%以上。