论文部分内容阅读
近年来,机器学习技术在人脸识别、物体检测、步态识别等各类模式识别问题上得到了广泛且卓有成效的应用。由于现实世界的复杂性,机器学习模型需要从极其凌乱的数据中挖掘出感兴趣对象的本质特征。尽管现今机器学习算法的健壮性不断提高,输入样本间对应关系的失配仍旧是影响模式识别系统性能的一大障碍。此类失配普遍存在于各类应用场景中,可能由于数据采集环境(比如摄像视角变化、复杂的背景)、自身形变(比如同类物体的个体差异、同一个体的姿态变化)、采集设备误差(比如可穿戴设备的佩戴牢固程度、设备的系统误差)等原因导致。在本文中,将解决这一问题的过程称为“数据的配准”。 当前,大部分的模式识别算法只对数据进行粗糙的配准,以在一定环境下得到比较合理的对象识别与检测性能。但诸如安全控制、自动驾驶、辅助医疗等对系统可靠性有较高要求的应用场景下,这却是十分不足的。更精细的数据配准可以有效地降低学习对象所处空间的复杂度,使得机器学习模型可以更容易地对对象建模,进而得到更准确可靠的输出。 数据配准问题主要由配准模型的结构、配准状态的求解、模型参数的学习、输入特征的提取等子问题构成。本文在这几个相互促进的层面研究了数据的精细配准。特别地,本文从提高局部性的角度分别为图像、时序序列建立结构细化的配准模型,以细粒度的搜索方式提高配准状态的准确性,通过直接针对配准的训练目标提高配准模型的精确度,并讨论了如何高效率地提取信息量丰富的局部特征。本文以几个具体的对象检测与识别问题为例,分别从这四个层面进行了有益的探索,提出了若干具体解决思路。具体如下: 1.整体约束下的局部配准模型 通过对特定局部分别建模,配准过程可以在局部上具有更强的特异性,并在整体上具有更高的自由度。然而,过高的模型自由度使得配准过程有破坏原始样本本质特征的风险,进而给后续的模式识别带来危害。本文以人脸对齐与识别为应用,在构建部件级的配准模型的同时,引入了基于贝叶斯网络的易于求解的整体约束项,从而平衡了提高模型自由度和保持数据本质属性这两个目标。 2.周期性序列的局部配准模型 很多以时序信号为研究对象的模式识别问题,都要以不定长的数据为输入。这类数据可能具有一定量的周期性的或可重现的信号模式,同时也会包含大量的随机或不稳定模式。尽管整体配准对于此类数据通常不可行,但针对其局部稳定模式的配准仍对其识别问题的解决有很多益处。针对步态加速度身份识别这一新颖的应用问题,本文提出了一种发现显著局部特征的方法,对局部模式进行隐式的匹配,并实现从局部到整体的识别过程。 3.高效的精细搜索算法 数据的配准可以被建模为一个最优解搜索的问题。在实际问题中,该最优化问题的目标函数往往极其复杂、并具有大量的局部极值,从而使得最优解的搜索变得十分困难。很多现有算法都采用较粗糙的搜索方法,以牺牲配准精度为代价来得到合理的计算效率。针对物体检测这一重要计算机视觉问题,本文基于贝叶斯优化框架,提出了一种以少量计算复杂度增加为代价,而显著提升配准精度的对象定位方法。 4.高精度的配准模型训练目标 配准目标本身的质量也是实现精细配准的一个关键要素。不论应用多强的搜索算法,都不能靠一个粗糙的配准目标达成细粒度的数据配准。当前应用于物体检测、人脸识别等问题的算法,或是将配准与识别的过程分离;或是只以识别任务构造配准模型的学习目标,而忽略了数据的配准精确性。为了得到更好的配准目标函数,本文构建了识别与配准的联合学习目标。特别地,针对物体检测这一问题,本文结合类别认证和物体定位两个目标对整体模型进行训练,并与前述精细搜索算法结合。 5.计算高效的不规则区域局部描述符 提取信息量丰富的局部特征是提高数据配准精度和取得准确识别结果的关键。在图像上,提高用于提取特征的局部区域的多样性是一种取得更加丰富的局部描述符的有效手段。然而,在大量不规则局部区域计算特征会导致巨大的计算代价。针对图像分析中常用的直方图特征,本文提出了一种新颖的增量计算方法,并用其在相互密集覆盖的不规则区域上高效地提取局部描述符。