基于CCA子空间的自动图像标注与应用研究

来源 :安徽大学 | 被引量 : 0次 | 上传用户:zhouheknight
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自动图像标注(AIA)是图像检索领域中一个十分重要的研究工作。自从AIA技术诞生以来,人们对其的研究就从未终止。对于如何获取有效的描述图像语义信息的图像特征,以及如何构建有效的标注模型,还有如何对已经标注出的图像候选标注词进行优化。这些对于解决图像标注中的“语义鸿沟”问题是十分重要的。有效的标注模型或方法的构建,对于改进AIA的性能与效率会起到很重要的作用。(1)研究了依据典型相关分析(CCA)组合颜色与纹理特征的方法。该策略首要考虑的问题是图像特征的提取。通过对比现有特征信息的优劣不同,选取颜色与LBP纹理算子,作为要进行融合的特征参数。凭借CCA在这方面的优势,获得了优良的表达视觉语义的信息。该方法解决了图像特征经常不能有效的描述图像的语义信息的问题。对于提高图像的检索与标注效率,起到了很重要的促进作用。同时该特征也是用来为后续内容的图像标注做基础的。本文进行自动图像标注所使用的图像特征就是通过该方法得来的。通过实验验证,也证明了此种特征的有效性。(2)为了提高自动图像标注精度,利用CCA技术,结合高斯混合模型(GMM)模型,研究了一种基于CCA和GMM的自动图像标注算法。该算法借助于CCA对选取图像的两种全局图像参数进行处理,减除了因单种特征描述图像的不足。还避免了由不完美的分割算法带来的表达语义不清错误。使用此新的特征来标注图像。利用GMM来估计图像特征与标注词的联合概率密度,得到其概率分布,构筑标注模型。在Coral5k图像集上进行验证,表明了此方法对于图像标注,性能上有了提高。(3)利用图像特征和标注词特征之间的关系,将这两种特征进行CCA融合,形成了一个结合CCA的标注与优化策略。该方法使用图像的局部特征,同时考虑到了图像的低层特征与标注词特征之间的相关性。利用典型相关分析(CCA)来探究这种关系,得到了CCA子空间特征,这是两种特征之间最有用的信息。为了使得图像的特征所在空间一致,将待标注图像局部参数信息通过CCA典型变量投影到与训练集CCA特征一致的空间。使用该特征,结合GMM模型,和贝叶斯分类器来构筑标注模型。同时对于计算出的候选词组,根据关键词之间的相似关系,执行标注优化。该方法在低层图像特征与高层的图像语义之间构建了一个非常有用的“桥梁”。为了测试该方法的有效性,在JMLR2003图像集上,进行了验证,实验表明,以查准率、查全率为评价标准,该方法使得图像的标注性能有了很大的提高。(4)将图谱的理论引入AIA中,借助图论的知识来改进标注的性能,研究了基于K-调和均值谱聚类算法(KHMSC)的自动图像标注算法。在K-均值的基础上,加入了调和概念,结合谱聚类的知识形成KHMSC算法。最主要的是,该算法通过二次聚类,得到用来表示图像语义的区域语义块。首先,在关键词向量空间利用KHMSC聚类,形成n个语义类概念。而后,在每一个类所在的图像特征空间内执行第二次聚类,相似的特征就会被聚集到一起,这样就形成了k个语义块。使用Davies-Bouldin指数来确定最优的语义块数目。该方法使用的特征也是通过CCA来进行提取的。这些语义块与关键词间的概率就是该方法所需要求取的统计变量信息。使用多重伯努利模型来估计此分布信息。最后利用朴素贝叶斯模型来得到标注词与测试图像的联合概率分布,构筑此标注模型。将概率分布最大的前R个标注词作为最后的图像标注词组。同样,我们在JMLR2003图像集上,验证了此图像标注算法的性能,证明该方法对构建图像低层特征与高层语义之间的一致性信息是有用的。典型相关分析对于研究图像的不同视觉特征之间的关系是非常重要的。利用这个性质来抽取表达图像视觉信息的准确特征。在此基础上,借助不同的图像标注算法来进行图像标注。本文从图像的特征提取、构筑有效的标注模型、对得到的标注词进行优化三个方面来改进图像标注的性能。取得了很好的效果。
其他文献
材料中局域源快速释放能量产生瞬态弹性波的现象称为声发射(AE),声发射技术作为一种成熟的无损检测方法,现在已被广泛应用于许多领域。人们利用声发射技术可以确定声发射源的
近年来,遥感技术迅猛发展已经广泛渗透了国民经济各个领域,对于推动社会进步、经济建设、国防建设和环境改善方面都发挥了重大的作用。所有相关单位都或多或少的涉及了该技术的
数字图像已经成为一种新的信息传输媒体,数字图像有着其自身的特点和优势,数字图像包含的信息具有很强的直观性和简洁性。数字图像在形成、传输、生成等诸多过程中容易受各种
哈希函数是密码学的核心技术之一,在信息安全领域有着不可替代的地位。哈希函数因其单向的特性,在安全通信方面起着重要的作用,可用于保证数据完整性和实体认证,更是很多密码算法
随着互联网的迅猛发展,我们迈进了大数据时代。随之而来的信息超载问题也日益明显。推荐系统应运而生,在信息的生产者与消费者之间架起了沟通的桥梁,根据用户偏好将个性化信
中学数字化校园的建设工作已成为推进教育均衡化发展,引领教育现代化发展的核心推动力之一,如何提升总体设计水平,避免孤岛建设、重复建设等误区,成为该领域的重要研究问题。本文
粗糙集作为一种新的处理不精确、不确定和不完备数据的数学工具,已被广泛应用于模式识别、数据挖掘和决策分析等众多领域。粗糙集的主要应用是属性约简,属性约简在利用粗糙集技
随着近年来学术网络信息的快速增长,对学术网络的管理与应用也变得尤为重要。学术网络是由论文、会议、作者等多种不同类型的对象构成。这些异构对象之间互相依赖,存在着紧密的
互联网的普及给人们提供了更加便捷的信息获取途径,但是,互联网中充斥着大量信息,人们需要花费大量的时间进行筛选以获得自己需要的信息,这种信息过载的现象困扰着人们对有效信息
粒子群优化算法(PSO)是一种基于群智能的优化算法,其算法简单、收敛速度快、全局搜索能力较强,仅需调整少量参数,并且在不同的优化问题中具有较为广泛的适用性,因此自提出以来就