论文部分内容阅读
随着互联网技术、智能通讯手段等的快速发展,数字图像已成为网络资源中的主要表现形式。图像资源的爆炸式增长,就需要有与之相适应的图像资源管理体系。为满足用户对图像的多元化需求,从浩如烟海的网络图像资源中便捷地找到所需图像成为亟待解决的问题。当前的图像检索技术存在诸多问题,如人工标注的主观性和低效率问题以及根据内容检索面临无法跨越的“语义鸿沟”现象等,图像语义自动标注则是解决这一系列问题的有效途径。本文在总结图像语义自动标注技术的研究进展和面临的突出问题后,提出一系列有针对性的改进方法,主要研究工作如下:标注模型的生成阶段:(1)不同特征对聚类影响的大小是不同的,本文提出一种新的特征加权算法—基于类内类间距离的权重分析,该算法弥补了Relief F算法抗噪性能弱和容易陷入局部最优的缺陷,实验结果表明该算法极大提高聚类准确性。(2)本文提出2D视觉特征聚类算法(Cluster based on Depth and Density),该算法分两步分别确定聚类类别数和初始聚类中心,克服了K-means算法对初值依赖性过强,且不稳定的缺陷。最后通过聚类熵评价不同方法的聚类效果。(3)本文在利用视觉特征聚类之后进行了基于语义的再聚类,该过程充分利用语义信息将视觉特征相似但语义特征不同的样本区分开。该模型能够克服传统的生成模型利用大量“无关”的训练样本对待标注图像进行概率计算的不足,有效地缩减了“语义鸿沟”。图像语义的标注阶段:(4)通常并不能将图像部分区域标注结果的简单累加作为整幅图像的标注。人对图像的感兴趣部分是局部的,而这部分涵盖了一幅图像的主要语义信息。本文引入SR显著性检测作为图像区域的语义贡献度。(5)对于标注结果的选择,本文除采用基于概率分布函数进行信息量累加获取阈值外,还考虑了置信度影响因子,借用机器挖掘领域的Apriori算法挖掘语义间的关联规则,并用该规则完善图像的标注。