多视角目标类检测算法研究

来源 :南京大学 | 被引量 : 0次 | 上传用户:wdhpll
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,多视角目标类检测在计算机视觉和多媒体领域受到了越来越多的关注,而检测的对象也由多视角人脸和行人扩展到一般的多视角目标。该研究中最具挑战的问题之一是如何检测任意视角的目标类别。同类目标不同实例之间颜色、纹理等外观信息差别很大,而且由于多视角的影响,不同视角之间的同类类目标差别也很大,因此,解决该类问题必须同时处理类内外观和观察视角变化的双重影响。目前,对同类目标外观的建模已有很多高效的算法,但对不同视角的同类目标间的视觉建模目前还缺乏研究,其主要原因是同类目标的不同视角之间底层特征较难找到有效关联,导致了相关算法的不精确性。同时考虑目标外观和多视角因素来建立多视角目标检测的算法模型更具挑战性。本文就多视角目标类检测算法进行了深入的研究,针对多视角目标类之间的关联提出了两种可能的解决途径。第一,针对目标的不同视角训练独立的分类器,用于该视角下的目标检测,利用视角之间的位置关系将这些独立的分类器对应到视角球面之上,之后通过将视角球面三角化从而建立视角分类器之间的关系,在检测阶段通过三角融合各个分类器的输出给出最终的检测结果;第二,为目标的不同视角建立可用于检测的视觉码本,视觉码本包含目标中存在显著轮廓或形状信息的局部结构,之后通过关联不同视角间的相似的局部结构从而建立视觉码本间的关联,形成用于描述目标任意视角的多视角码本,可用于任意视角的目标检测与视角估计等任务。两种方法都在公共数据集上验证了方法的有效性,和当前的其它方法做了对比。本文的主要贡献如下:1.针对多视角目标检测中的融合多分类器方法,提出了一种基于视角球面的三角化融合机制,通过不同视角的分类器完整覆盖整个视角球面,从而达到检测任意视角目标的目的;2.利用树结构来组织目标类的视觉码本,树的构建过程即是码本的生成过程,而树结构能有效减少了码本匹配时的计算量和计算时间。检测的过程通过匹配的码本入口的霍夫投票得到霍夫图像,霍夫图像中的局部极大值就对应着目标出现的位置。3.通过低层特征的关联建立不同视角之间视觉码本的关联,将多个视角的信息在更早的阶段关联起来,形成描述多视角物体的多视角码本结构。
其他文献
该文主要讨论了高速矢量光栅转换技术的理论基础和算法实现.根据矢量图形的特点,详细讨论了提高矢量光栅转换速度的重要技术-宽直线段的生成和多边形的扫描填充算法.文中对现
网络管理是一个由来已久的问题,但是长期以来,网络管理的研究范围局限于网络本身的特性,不能适应当前服务驱动网络的需求。 本文的研究动机来源于计算机技术和网络通信技术的
AAA认证技术是近年来最先进的网络安全技术之一,它已经成为解决远程拨号用户安全问题的国际标准.AAA认证技术应用于内部网络,通过对内部网的安全服务器上的运行的AAA认证软件
作为多的局部数据库具有大量的有用信息.如果能够充分利用该些信息,往往可以大大减少多数据库查询处理的开销.人们发现多数据库的语义冲突信息是实体化方案选择的有用信息,因
该文从整体上分为三部分;第一部分阐述了可视化数据挖掘的基本理论,并且对可视化数据挖掘中几种常用的可视化技术进行了着重的分析和介绍;第二部分提出了可视化数据挖掘的组
满足各种时间约束是实时嵌入式系统设计的一个重要目标。通常,时间约束要求实时系统在满足功能性需求的同时,还必须保证系统行为的时效性,即系统必须在确定的时间内执行其功
该文根据哈工大校园网建设与管理的实际需要,为解决校园网计费管理问题而对网络计费管理进行了研究,并对整个系统进行了实现.该文首先对网络中的TCP/IP(Transmission Control
近年来Internet已经发展成为一个全球性的数据网络,吸引了大批的用户,随着网络上信息的不断丰富和多媒体应用的展开,Internet的发展势头更加强劲.虽然Internet在可靠性和服务
该文研究了遗传算法在ATM网络路由规划选择中的应用,重点研究如何加快遗传算法的收敛速度以求得全局最优解的问题.在此基础上,结合ATM网络路由本身的一些参数特性,运用约束条