论文部分内容阅读
随着网络和多媒体技术的飞速发展,图像信息大量的涌现到人们的生活中。因此,如何从浩瀚如海的图像信启中查询到用户感兴趣的图像已经成为一个热门的研究课题。近年来,研究人员更多的注重于主观感性认识,人们迫切需要一个以人的感性认识为核心的图像检索系统。现在的图像检索方法大多是基于视觉内容进行的检索,随着技术的发展,这种检索方法只能部分满足用户的需求。提取图像信息的语义内容在现代的图像检索技术中起着非常重要的作用,特别是在广告、娱乐、建筑以及设计等领域表达情感的内容显得尤为重要。因此,出现了基于感性认识的图像检索系统(Kanseiimageretrievalsystem),如K-DIME,K-agent,IQI等。
感性图像检索是一种新型的检索技术,这种检索具有较高的复杂性。由于感性图像检索在方法上还存在着一些困难,因此通过计算机处理的机器视觉的识别还不易实现。不同的人对于同一幅图像具有不同的理解和认识,于是不同的人对于同一幅图像会出现不同的感性认识,所以在测量和量化感性特征时具有不精确性和模糊性。随着模糊理论和神经网络等相关学科的发展,感性图像检索中存在的许多问题得到了解决。本文对感性图像检索的理论和应用做了深入的研究,并提出了进行感性图像检索的一些新方法。
颜色是图像最重要的特征,文中把颜色作为图像特征与情感特征建立映射关系,并且使用主成分分析法对其降维,有效的利用了图像特征,减少了复杂度。映射的结构在检索中是一个关键的环节,BP神经网络有着很强的分类能力,有效的将图像特征与情感特征建立映射关系。实验证明,使用主成分分析降维后的图像特征通过BP神经网络的映射不仅没有降低检索准确率,还提高了检索速度,降低了复杂度。
图像中能够使人们产生感性认识的可能只有部分区域,准确的找到感兴趣区域能有效的降低复杂度。感兴趣区域能引起人们产生某种感性认识,并且它们对此感性认识的贡献是不相同的。作为图像基本特征的颜色对人的感觉有重要的影响,颜色的差异和对比使人产生了不同的情感。同时,图像的熵也反应了图像中包含信息量的大小,它也是引起人们产生感性认识的一个度量。本文提出了利用图像的颜色和熵提取感兴趣区域进行感性图像检索的方法,通过BP神经网络将感兴趣区域的颜色特征和熵映射到情感特征空间,实验证明此方法的检索效果比较理想。
颜色是图像的一个重要特征,而目前流行的利用颜色特征进行图像检索的方法具有简单高效的优点,但却丢失了颜色的空间分布信息。另一方面,虽然图像的全局熵衡量了图像包含信息量的大小,但它只能反映图像的整体灰度分布,局部熵却能够体现出图像的颜色信息和形状信息。本文采用局部熵作为感性图像检索的底部特征,经过主成分分析法去相关并结合图像的频谱,将局部熵和频谱用神经网络映射到情感特征空间,对图像库中的图像进行检索,具有较好的检索效果。