论文部分内容阅读
随着多媒体时代的到来,图片作为传递信息的主要媒介,已经成为人们表达情感、进行社交活动的主要工具。然而图像数量的爆炸式增长,需要人们耗费越来越多的时间去检索出满足需求的图像,如何高效进行图像检索是一个急需解决的问题。 传统的图像检索方法主要是采用基于图像的底层特征,使用基于文本标记或者基于内容的图像检索,没有考虑到图像更高层次的语义信息,与人类对图像高层语义的理解之间存在着较大的语义差别,无法满足人们对图像情感语义的检索需求。针对这个问题,本文提出了基于改进版极限学习机(ELM)的图像情感语义检索系统,主要从情感空间的建立、图像底层特征向量的提取和降维、改进的ELM训练和测试进行研究。 (1)情感空间的建立 本文分析了情感研究的理论基础,研究了图像底层特性与情感语义之间的对应关系,通过情感标记实验的统计对图像库进行情感分类,建立图像与情感分类的对应关系,形成情感图像库。 (2)图像底层特征向量的提取 图像的底层特征向量是进行图像检索的基础,本文从图像的颜色、纹理和形状三个方面对图像的特征向量进行提取,为了避免维度灾难,减少计算的复杂性,使用主成分分析法对提取的特征向量进行降维,形成图像特征库。 (3)极限学习机的训练和测试。 极限学习机为单隐层前馈神经网络,比传统前馈神经网络的训练具有更高效率。本文对ELM进行改进,通过训练得到50个ELM,使用遗传算法对ELM参数进行优化再选取最优的10个ELM并进行组合形成集成ELM,利用集成ELM对图像进行情感的识别,达到图像情感语义检索的目的。 (4)原形系统的设计和实现 基于以上技术,本文设计了基于改进ELM的图像情感语义检索系统,通过该系统用户可实现文本输入和图像输入两种方式的图像情感语义检索。