论文部分内容阅读
随着20世纪90年代多媒体技术及Internet网络的发展,多媒体信息的广泛使用将极大地方便和丰富人们的生活、学习和工作。如何组织、表达、存储、管理、查询和检索这些海量的数据,是对传统数据库技术的一个重大挑战。所以,传统图像数据库的检索方法经历了从基于文本(Test)方式到基于内容(Content)方式的改进,目前基于内容的图像检索技术在国内外已经取得了不少成就。同时,对图像数据库的组织和管理是否合理成为用户检索的关键所在,为此在用户检索之前将图像数据库中的所有图像进行聚类是很有必要的。随着图像检索系统的不断改善,基于图像情感语义的聚类会成为进一步的研究课题。另一方面,很多生物机体在动态竞争的环境中展现出了强大而复杂的学习和问题处理能力,生物机体的这些特性,激发了人们的思维,促进了人类科学技术的发展,近年来兴起的人工免疫系统的研究又是一个崭新的应用领域。其中,基于免疫原理的聚类算法,可以对包含数值属性和符号属性的数据进行聚类,具有较强的适应性。在进行聚类之前应该先提取图像特征并进行量化处理,量化后所得到的数据将作为聚类分析的输入数据。基于上面提到的几个问题,本文主要进行了以下几方面的工作,首先,在简单介绍了图像的低层物理特征和图像颜色特征提取的典型方法的基础上提出了一种综合图像颜色、空间信息的特征提取方法:空间直方图度量法。该方法的主要思想是:利用颜色直方图来统计整幅图像色彩的信息;用分块颜色中心矩来统计色彩的空间分布信息。最后对两种特征失量以某种权值加权累加。本文还总结了主要颜色所蕴含的情感语义信息,以便今后进一步研究工作的展开。其次,分析了传统聚类方法所存在的一些典型问题,提出了将人工免疫算法运用到图像聚类中,并对算法设计步骤进行了详细的描述。最后,实验部分主要包括四个模块,即图像获取、图像特征提取、免疫聚类分析和结果分析。本文主要提取图像的颜色特征,进行量化后作为聚类的输入数据,同时,本文还实现了传统k均值聚类算法,经过比较,证明本文将人工免疫算法应用到图像聚类中性能优于k均值算法,同时证实通过聚类能更好地改善图像检索系统的检索效率。