论文部分内容阅读
基于内容的多媒体检索是指根据媒体对象的语义、特征进行检索,如图像中的颜色、纹理、形状,视频中的镜头、场景、镜头的运动,声音中的音调、响度和音色等。基于内容的多媒体检索,包括图像、音频和视频等信息的检索,本文主要是对基于内容的图像检索进行了研究。基于内容的图像检索(Content Based Image Retrieval,简称CBIR),是指直接根据描述图像内容的各种特征进行检索。近十年来,基于内容的图像检索是当前计算机视觉、图像数据库与知识挖掘等领域最活跃的研究热点之一。 人眼在观察一幅图像时,总是很自然地将图像分成目标和背景。一般人对计算机检索结果的评价也主要是以目标来衡量的。一般来说,目标物体所在的区域应该是图像中最引人注目的地方,具有最清晰的轮廓、最完整的边缘和最突出的面积。在图像检索中目标区域比背景区域更符合人眼的视觉感受,由目标区域所抽取的图像特征更适合图像检索的需要。本文对基于目标区域的彩色图像检索进行了研究,并给出了基于目标区域的彩色图像检索算法。实验表明,基于目标区域的彩色图像检索算法优于基于全局图像的检索算法,基于目标区域的彩色图像检索结果更符合人眼的视觉感受。 纹理是图像中一个重要而又难于描述的特征,至今还没有公认的精确定义。纹理是人眼视觉的重要组成部分,反映了物体的深度和表面信息,提供人眼视觉识别和理解物体的信息。从人的感知经验可知,粗糙度、对比度和方向性是人们区分纹理时所用的三个最主要特征,其中粗糙度是最基本、最重要的纹理特征。本文对原有Rosenfeld纹理粗糙度算法在选取邻域尺寸和计算邻域均值差值这两个方面进行了分析和改进,并给出了改进纹理粗糙度算法。实验表明,改进纹理粗糙度具有更强的纹理分辨能力和更好的旋转不变性,基于改进纹理粗糙度的图像检索结果优于基于原有纹理粗糙度的图像检索结果。 商标是商品的一个重要标识,代表了商品的质量与生产厂家的信誉,在市场经济中起着重要的作用。商标图像属于人工图像,没有自然图像的复杂背景和目标,而且商标图像的各个部分具有相对明显的分界,每个部分在大脑中会形成相对独立的印象。从商标图像中抽取出若干幅互不连通的子图像,子图像特征能够反映出局部图像特征。局部图像特征在表达图像内容方面与全局图像特征相辅相成,在商标图像检索中对子图像特征进行融合可以获取更好的检索性能。本文提出了基于子图像特征融合的商标图像检索算法,并对子图像特征融合准则进行了研究。实验表明,基于子图像特征融合的商标图像检索算法优于基于全局图像特征的检索算法,子图像特征融合加权准则优于未经加权的子图像特征融合准则,其中最小加权平均准则最优。 本文设计了一套基于内容的图像检索实验系统,主要是作为各种检索算法 摘要的测试平台,是一个实验性的框架系统。实验系统的开发平台为MICrOSOWndowS 2000,开发工具为 Vd C”6.0。渊将对系统进行进一步的开发,使之成为一个真正实用的商用系统。