对象识别与检测中的数据配准方法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:liuyu80237029
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,机器学习技术在人脸识别、物体检测、步态识别等各类模式识别问题上得到了广泛且卓有成效的应用。由于现实世界的复杂性,机器学习模型需要从极其凌乱的数据中挖掘出感兴趣对象的本质特征。尽管现今机器学习算法的健壮性不断提高,输入样本间对应关系的失配仍旧是影响模式识别系统性能的一大障碍。此类失配普遍存在于各类应用场景中,可能由于数据采集环境(比如摄像视角变化、复杂的背景)、自身形变(比如同类物体的个体差异、同一个体的姿态变化)、采集设备误差(比如可穿戴设备的佩戴牢固程度、设备的系统误差)等原因导致。在本文中,将解决这一问题的过程称为“数据的配准”。  当前,大部分的模式识别算法只对数据进行粗糙的配准,以在一定环境下得到比较合理的对象识别与检测性能。但诸如安全控制、自动驾驶、辅助医疗等对系统可靠性有较高要求的应用场景下,这却是十分不足的。更精细的数据配准可以有效地降低学习对象所处空间的复杂度,使得机器学习模型可以更容易地对对象建模,进而得到更准确可靠的输出。  数据配准问题主要由配准模型的结构、配准状态的求解、模型参数的学习、输入特征的提取等子问题构成。本文在这几个相互促进的层面研究了数据的精细配准。特别地,本文从提高局部性的角度分别为图像、时序序列建立结构细化的配准模型,以细粒度的搜索方式提高配准状态的准确性,通过直接针对配准的训练目标提高配准模型的精确度,并讨论了如何高效率地提取信息量丰富的局部特征。本文以几个具体的对象检测与识别问题为例,分别从这四个层面进行了有益的探索,提出了若干具体解决思路。具体如下:  1.整体约束下的局部配准模型  通过对特定局部分别建模,配准过程可以在局部上具有更强的特异性,并在整体上具有更高的自由度。然而,过高的模型自由度使得配准过程有破坏原始样本本质特征的风险,进而给后续的模式识别带来危害。本文以人脸对齐与识别为应用,在构建部件级的配准模型的同时,引入了基于贝叶斯网络的易于求解的整体约束项,从而平衡了提高模型自由度和保持数据本质属性这两个目标。  2.周期性序列的局部配准模型  很多以时序信号为研究对象的模式识别问题,都要以不定长的数据为输入。这类数据可能具有一定量的周期性的或可重现的信号模式,同时也会包含大量的随机或不稳定模式。尽管整体配准对于此类数据通常不可行,但针对其局部稳定模式的配准仍对其识别问题的解决有很多益处。针对步态加速度身份识别这一新颖的应用问题,本文提出了一种发现显著局部特征的方法,对局部模式进行隐式的匹配,并实现从局部到整体的识别过程。  3.高效的精细搜索算法  数据的配准可以被建模为一个最优解搜索的问题。在实际问题中,该最优化问题的目标函数往往极其复杂、并具有大量的局部极值,从而使得最优解的搜索变得十分困难。很多现有算法都采用较粗糙的搜索方法,以牺牲配准精度为代价来得到合理的计算效率。针对物体检测这一重要计算机视觉问题,本文基于贝叶斯优化框架,提出了一种以少量计算复杂度增加为代价,而显著提升配准精度的对象定位方法。  4.高精度的配准模型训练目标  配准目标本身的质量也是实现精细配准的一个关键要素。不论应用多强的搜索算法,都不能靠一个粗糙的配准目标达成细粒度的数据配准。当前应用于物体检测、人脸识别等问题的算法,或是将配准与识别的过程分离;或是只以识别任务构造配准模型的学习目标,而忽略了数据的配准精确性。为了得到更好的配准目标函数,本文构建了识别与配准的联合学习目标。特别地,针对物体检测这一问题,本文结合类别认证和物体定位两个目标对整体模型进行训练,并与前述精细搜索算法结合。  5.计算高效的不规则区域局部描述符  提取信息量丰富的局部特征是提高数据配准精度和取得准确识别结果的关键。在图像上,提高用于提取特征的局部区域的多样性是一种取得更加丰富的局部描述符的有效手段。然而,在大量不规则局部区域计算特征会导致巨大的计算代价。针对图像分析中常用的直方图特征,本文提出了一种新颖的增量计算方法,并用其在相互密集覆盖的不规则区域上高效地提取局部描述符。
其他文献
目前,对业务变化的应对能力是企业生存和发展的关键所在,面向服务架构(SOA)为有效解决上述问题提供了新思路,但将SOA真正应用到实践中还必须准确把握SOA关键技术特点及应用模式
学位
目标散射特性和天线辐射分析,是雷达技术领域重要的研究内容。在现代战争中,武器平台的隐身和反隐身设计直接决定了其生存能力。进气道是腔体结构,对飞机的雷达散射截面有着显著
嵌入式系统是当今最热门的概念之一,是当前电子技术发展的又一新热点。它具有体积小、性能强、功耗低、可靠性高以及面向行业应用等突出特征,目前已经广泛应用于军事、消费电
工作流的概念起源于生产组织和办公自动化领域,目的是提高办事效率、降低生产成本、提高企业生产经营管理水平和企业竞争力的目标。随着知识经济的发展以及Intemet技术的迅速
视觉跟踪是计算机视觉中最基本的问题之一,在多媒体领域中有着广泛的应用需求,比如监视、车辆导航、人机交互等等。近年来,随着深度学习及其相应硬件条件的发展,单目标视觉跟踪任
日常生活和工作中,不管是个人还是企业,每个月都要收到各种催款单,包括公用事业的定期缴费、非公用事业的定期缴费、不定期的账单、还有逾期账单等等。目前这些账单的付费方式,有
视频监控系统由于其直观性、实时性、易保存回放等特点,广泛应用于电信、银行、学校、工厂等部门。近年来,结合网络、多媒体和存储技术的发展,使得视频质量、监控范围、存储能力
现代物流的日益增长对集装箱码头的货物周转速度提出了更高的要求。为此,必须提高装卸集装箱岸吊的运行速度,以达到提高码头货物周转效率的目的。迄今已经出现了很多集装箱卡车
本课题研究的内容是IP-PBX中ENUM支持机制的设计与实现,目的是实现IP-PBX间的安全高效互通。近年来,随着企业通信的迅猛发展,作为企业通信门户的IP-PBX,尤其是嵌入式IP-PBX以
随着网络技术发展和网络应用的日益多样化,传统互联网体系结构中网络控制灵活性不足、网络资源利用率低等刚性技术弱点逐渐凸显,为此迫切需要找到一种能使网络需求与资源有机适