基于内容的图像标注改善算法研究

来源 :厦门大学 | 被引量 : 0次 | 上传用户:pgq1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像自动标注隶属于计算机视觉、模式识别、信息检索以及机器学习等领域,在学术界和工业界均得到高度的关注,但是由于图像自动标注存在数据集的不平衡性,底层视觉特征与用户高层语义之间的鸿沟等问题,使得图像自动标注仍然面临着许多困难,针对上述情况,本文开展了如下四个方面的研究工作:   1、针对数据库词频分布不平衡问题,提出了一种基于平衡数据库的图像自动标注改善的方法。这个方法主要是通过自动平衡模式找出弱频点,并依据基于外部数据库自动平衡模式对弱频点以下的弱频词,从外部数据库中追加相应数量的图片。通过找到数据库的最佳平衡状态,以及词频的最佳分布使得数据库达到最佳平衡状态,并使得最终标注结果的精确率、召回率、F度量和至少正确标注一次的关键词数等指标得到一定提高。   2、提出了基于关键词同现的图像自动标注方法。现有图像自动标注模型为了计算方便,假设标注词之间都是相互独立的,忽略了关键词间相关性对最终标注结果带来的影响,针对以上问题,我们提出了基于关键词同现的图像自动标注方法。该方法根据关键词同现(Co-occurrence)的频数计算关键词间的相关性,并根据词频间的相关性建立关联度衡量模式。为了充分考虑关键词间的关联性,采用k-1层关联算法计算关键词之间的关联度,并将该关联度与已经得到的标注模型的标注结果相结合,使得最终的图像标注结果得到提高。   3、提出了基于Wordnet的图像自动标注模型。该模型先通过CMRM方法对图像进行标注,根据得到的关键词标注概率,选取标注词概率较大的前n个关键词作为候选标注词。通过结合JNC方法与BNP方法,建立了关键词间相关度的度量模式,通过此模式来度量n个候选关键词间的相关度,筛选出相关度最大的前五个关键词作为最终的标注词,该标注方法可以在一定程度上更好的解决语义鸿沟问题,并最终提升图像标注结果。   4、提出了基于语义相似的图像自动标注模型。该模型将前面提出的关键词同现方法与Wordnet相结合来计算关键词间的相关度,并实现最终的图像自动标注改善模型。通过最后的实验,表明建立平衡数据集以及考虑关键词问的各种关系(如词频同现、词频注释集、上位词与下位词等),均对标注结果有一定的改善。我们的模型在一定程度上解决了语义鸿沟问题,并最终提升图像标注结果。   本文提出的模型均以通过实验验证,图像自动标注的精确率,召回率,F度量以及至少被正确标注一次以上的关键词数量均得到了一定程度的提高,尤其是召回率及至少被正确标注一次以上的关键词数量得到了较大的提高。  
其他文献
自从改革开放以来,我国经济高速地发展,航海运输业也日益繁荣。随着港口货物吞吐量的迅速增加,船舶交通量的不断增大,通航环境越来越复杂,水上交通安全管理的难度也逐渐加大。所以
Android系统作为智能手机的主要操作系统之一,凭借其强大的功能,丰富的应用获得了用户的青睐,市场占有率稳居第一。然而,Android系统在为人们提供方便产生极大经济效益的同时
随着网络信息技术的飞速发展,用户可以通过网络方便快捷地利用海量的共享信息,同时“信息爆炸”、“信息过载”、“信息垃圾”等很多问题日趋严重。而且那些无用或者有害信息
KTA是基于H.264视频编解码标准而建立的一套实验模型,它在H.264原有的基于块的运动补偿和变换的编码框架基础上,研究新技术以进一步提高视频编解码效率。KTA是介于H.264和新
随着银行业务的不断发展,从以前的客户存款、取款、贷款等等到当今的家庭各项费用开支(包括水费、电费、煤气费等等)、小额贷款都可以通过银行来办理。现金收发管理设备,诸如
作为模拟仿真领域目前研究的热点问题之一,气体泄漏扩散过程仿真日益受到关注。从国内外的研究现状出发,分析和比较了当前常见的气体泄漏扩散仿真模型的优势和不足。针对这些
年龄是人的重要属性。近年来,用户年龄自动估计技术逐渐成为一个涉及模式识别、计算机视觉、语音识别和机器学习等领域的活跃课题。该技术在现实世界中有很多应用,如法医学、电
当今的制造系统正受到高要求快变化的环境形势所挑战。工业企业必须实施控制政策以及调整自己的制造系统,以最大限度地提高生产率、降低成本和提高质量,同时还要应付强大的竞
肝脏是人体内最大的实质性脏器,以代谢功能为主。肝脏内部管道系统交错重叠,包括门静脉、肝静脉、胆管及肝动脉,存在很大的变异性。为了全面、准确地了解肝脏内管道系统的情
随着智能体理论与技术的发展,多智能体系统在科学研究、互联网、生产控制、金融服务、企业管理等诸多领域中有了较广泛的应用,但在执行效率和效果上依然存在很大的提升空间,而面