论文部分内容阅读
二维物体识别是计算机视觉和人工智能领域的一个经典任务,被广泛地应用于图像理解、目标识别和场景分析等应用中。物体识别的基本问题是物体的表示和描述,通用的方法是借助于物体的颜色、纹理或形状信息。其中,形状也许是物体最为直观、重要的描述,仅通过形状信息,人类仍然可以轻松识别不同的物体及其类别。所以,基于形状的物体高效表示及识别一直是相关研究的热点问题之一。近期,二维形状表示及识别方面的研究进展包括基于深度神经网络的方法和基于生物信息学的方法等。不过,深度神经网络架构多针对二维图像分析领域设计,且一般需要大规模的标记样本,由于公开的二维形状数据集的样本规模往往较小,制约了深度神经网络在二维形状领域中的推广。基于生物信息学的二维形状表示的基本思想是把二维形状的轮廓转化为生物信息序列,借助标准的生物信息序列分析工具来进行二维形状的匹配和识别。目前的基于生物信息学的二维形状识别的发展也存在一些问题。第一,对形状进行编码是在形状的轮廓上进行,编码有时会产生冗余,实验中识别准确率不高;第二,目前二维形状的生物信息编码技术,未充分考虑如何使形状编码序列具有更多基因层面的信息。第三,在匹配阶段基本使用的还是双序列比较工具,匹配效率不高。为解决上述问题,本文提出了一种新型的基于生物信息学的二维形状识别方法。该方法通过结合形状轮廓和形状骨架各自的优点对形状信息进行编码,使用生物学基因序列比较工具对其分析和识别。具体地,在对形状进行编码的过程中,本文利用骨架表示形状的细长分支,提出形状轮廓和骨架的联合表示方案,并分别对轮廓和骨架进行不同类型的编码,减少编码的冗余。然后,本文通过分析生物信息中各种氨基酸的占比,对形状信息的编码进行映射,并结合现有的生物信息分析工具讨论了不同编码方式对形状识别结果的影响。最后,本文结合全局描述符如形状的面积、离心率或者深度特征描述符,进一步提升了本文形状表示和识别方法的准确率。为了验证所提出方法的性能,本文选取四个公开的形状数据集MPEG-7,Animal,ETH-80和Swedish leaf进行实验,并与多种现有的形状识别方法进行了识别准确率的对比。并进一步分析了不同形状编码方案和不同全局描述符对于形状匹配准确率的影响。在四个数据库的实验结果均表明,本文方法取得了较高的识别准确率,说明了本文提出的结合轮廓及骨架序列编码的二维形状识别的有效性。