基于图像结构的目标检测方法研究

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:leoni002
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目标检测是图像理解的核心问题,对图像中各种变化的处理是目标检测面对的主要难题之一。结构反映了事物的内在关系以及上下文约束,是图像中相对稳定的信息特征,能够为图像中各种变化的有效处理提供有力支持。本文以图像结构信息的分析和提取为切入点,研究基于图像结构的目标检测技术,根据不同的检测任务,提出了多种基于图像结构的目标检测方法。本文的主要研究内容与创新之处有:(1)提出了一种基于图像结构的目标检测方法。图像稀疏结构的学习首先形成图像的稀疏结构表示,然后在此基础上通过Gentle Boosting学习算法进行分类器的训练。针对单一目标产生多个检测结果的问题,提出了一种非最大抑制的方法,经过两次抑制操作保证了检测的准确性。(2)提出了一种基于轮廓的目标检测方法。该方法通过“平均”训练集中目标样本的轮廓特征来定义目标轮廓模板,然后,通过一个结合TPS变换的检测过程来捕捉图像中的目标。该检测过程开始于种子区域的选择,接着在TPS变换的基础上计算种子区域与目标的轮廓模板的差别,不断地调整种子区域的边界,逐步接近整个目标对象的区域。(3)提出了一种基于图像拓扑层次结构的目标检测方法。该方法将图像区域之间的拓扑关系表示为一个层次结构,并将目标区域的上下文约束表示为层次结构的一个路径,通过路径匹配方法就可以检测出图像中潜在的目标区域。(4)提出了一种基于多尺度Shape Context的目标检测方法。该方法使用不同尺度的目标部分构成目标的层次结构表示,把目标检测问题视为Bayesian MAP的优化问题,然后把MAP问题进一步转化为两个最大似然问题。通过两个似然函数的最大化,完成目标检测的任务。(5)提出了一种基于图像共享结构学习的目标检测方法。在共享结构的学习中,使用了一种简单的似然模型,该模型不需定义任何的结构形式,不需使用码字表,也不需指定特征拥有者,为各种复杂的图像结构的提取提供了足够的弹性。共享结构的学习采取无监督的方式进行,可以应用于各种复杂检测任务中。
其他文献
随着计算机技术与通信技术的迅猛发展,数字信息在世界范围内得到日益广泛的应用。然而,数字信息易于拷贝和发布给其应用带来了诸多安全问题。当前,数字信息在互联网和无线通
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
视觉注意可以把系统中有限的处理资源优先分配给少数几个显著的视觉区域。视觉注意的计算机模型研究对自动目标检测、图像和视频压缩、机器人场景分类和医学图像处理等多个领
一、引言词典学是编纂词典的学问。关于词典学的学科地位有着两种截然相反的观点:一种观点认为词典学隶属于语言学中的词汇学(也有学者认为词典学应为与词汇学地位相等的语言
随着网络时代的来临和自然语言处理技术在处理大量网络信息文本中的广泛应用,自动、高效的中文组块分析技术作为浅层句法分析的代表,成为了对信息进行处理与理解的关键技术,
随着计算机和互联网技术的发展,电子文件在电子政务网和企业内部网中得到广泛使用,其中不乏以电子文件形式存放的机密信息。由于电子文件易于复制和传播,而且复制后不留任何
马克思主义的唯物辩证法与中庸之道在不同的时代背景下得以产生,二者的研究理路虽有不同,但追求真善美在各种文化的交融中仍基本一致。本文从对立统一与物生有两、质量互变与
观察不同方言之间的接触现象对分析、梳理方言演变特征及轨迹起到重要作用。徐州市和铜山县两者虽然方言差异不大,但是两者行政归属上的“市辖县”和地理位置上的“县廓市”的
格子波尔兹曼模型(Lattice Boltzmann Model,LBM)是近年来兴起的一种求解偏微分方程的数值工具。目前,LBM在流体力学领域中的应用已经和传统的数值方法并驾齐驱,得到了国际上
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield