论文部分内容阅读
形状分析是计算机视觉与图像处理中一个重要的分支,被广泛应用于工程领域,诸如物体识别、医疗诊断、目标检索等。本文对现有的形状分析方法进行探索,并主要围绕形状的匹配与生成这两个子问题进行了研究。本文主要的工作分为两个方面:(1)设计了一个采用了动态角度划分的新形状描述子,并将其用于形状匹配问题研究;(2)将深度学习中变分自动解码器应用于二维物体的形状生成,并对模型网络的初始化参数设置进行了优化。形状匹配(Shape matching)通过对于物体形状特征的提取,在形状数据集中识别和检索出形状结构相似的物体。主流的形状匹配算法可以划分为基于物体形状轮廓和基于物体形状区域这两大类。在实际形状匹配应用中,存在着诸如尺度,旋转以及噪声等因素影响着匹配检索精度。目前大多数匹配算法着重于精度,对于时间负责度分析较少,然而随着现代图像摄像设备的广泛使用,图像数据量也呈爆发式增长,需要从海量数据中快速匹配相似形状也变得越来越重要。如何在形状匹配中平衡精确度与速度的关系成为了匹配算法的主要难点。本文基于物体的形状轮廓点集,以及观测视角的敏感度,提出了一种基于角度动态规划的新型描述子(Dynamic Angular Partition Descriptor)。DAPD本质上是对轮廓点的一个空间降采样,其算法时间复杂度较低,因而可以用于物体形状的快速匹配。通过实验证明,其相对于一些经典传统算法提升速度多达13倍,且匹配精度损失较小,从而可以达到在实际工程应用中从大量数据中提取出相同形状的效果。与此同时,本文对描述子的相似度衡量算法进行了优化,使得其能够对上述提出的几种常见影响因素有较好的鲁棒性,并通过实验进行了验证。形状生成(Shape generation)是指根据现有的形状数据集(形状轮廓点集或者物体形状的灰度图像集),能够抽象出这些形状数据所共同的低维特征,并且根据这些特征能够生成相同类别的物体形状,达到辅助人工作图等效果,其可以被广泛应用于诸如服装裁片、工程磨具制造等领域。形状生成面临着数据的维度高(像素点数量)、图像存在着人工作图或者采集导致的误差,无法精确采用几何方法表示等挑战。本研究采用深度学习中基于变分自动编码器(Variational Auto-Encoder)的方法进行形状生成研究,通过变分自动编码的编码器(Encoder)对数据进行编码,获得该形状的隐变量,再通过解码器(Decoder)生成形状。通过对编码器和解码器网络参数的不断迭代与优化,使得生成模型的概率分布能够接近于真实分布,从而建立起低维到高维的一种基于最大似然估计的概率分布空间,将抽象的几何特性通过概率空间分布的隐变量进行表示。该方法能够很好地减少由于偶然因素而导致形状误差所带来的影响,通过编码器和解码器网络,能够建立潜在空间与形状之间的关联,这样低维潜在空间中的采样点均可经过解码器生成高维空间中所需要的同类物体形状。本文通过若干不同的形状数据集进行多种不同维度的实验来对该算法效果进行评估,包括网络初始化参数实验、形状生成实验以及形状重构实验,并根据实验的结果进行分析。最后,本文以实际的服装裁片形状数据集,作为真实的应用场景。将裁片数据通过整理,再进行形状匹配获得相同形状子集,应用变分自动编码器生成出可能的潜在形状,验证了本文的实际工程应用价值。