论文部分内容阅读
随着网络技术、多媒体技术的快速发展和广泛应用,人们接触到越来越多的数字图像信息,但是这些图像一般分散在各种图像资源库中,缺乏有效的组织方式,给图像检索带来了困难。 基于内容的图像检索(CBIR)是当前多媒体检索技术的热点之一,它直接对图像内容(如图像的颜色、形状、纹理、背景等)进行分析,并对图像特征进行合理的描述,使得检索过程更加有效,更能适应人的视觉特征。形状是图像最显著的视觉特征之一,基于形状的图像检索是基于内容的图像检索的一个十分重要的方面,通过提取和描述物体的形状特征,利用形状特征间的相似度实现图像的检索。 图像形状特征的提取和描述方法是基于形状的图像检索的重要研究内容,本文对此进行了深入研究,详述了目前已有的形状特征描述方法,并对一些特征参数提取方法进行了改进,给出了相应算法。在此基础上,抽取一组特征值,形成特征向量,并进行归一化,然后利用BP神经网络进行形状识别。 本文对语义知识表示和描述方法进行了研究,对已有的语义知识描述方法做了简单的介绍,采用自然语言中的形状和姿态描述词来描述形状和姿态。形状的识别采用层次化多种方法:对形状参数有明显区别的形状(如条形的扁度、矩形的矩形度、圆形的圆形度等),采用形状参数直接识别;对于无法用形状参数直接区分的形状,采用BP神经网络进行模糊识别。 姿态是指主体所具有的自然形态,例如,鸟类的姿态主要有飞、栖两种。姿态识别是在确定了主体名之后,根据相应的主体类别来识别其姿态。本文利用BP神经网络来识别姿态,并对鸟类的姿态进行了识别测试,取得了较好的结果。 最后,在形状识别的基础上,对树叶的形状进行了检索实验,取得了较好的结果。 整个实验平台是以Windows 2000作为操作系统,使用Visual C++6.0和Matlab开发的。