基于多标签学习的图像语义自动标注研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:b56240320
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着多媒体数字化技术的发展和推广、存储成本的降低、网络传输带宽的增长,各种多媒体数据如图像、视频等飞速膨胀逐渐成为信息的主流,并对人们的生活和社会发展产生重要的影响。图像是视频的的基础,在多媒体数据管理中占有重要的地位,如何有效的管理这些大规模图像数据已经成了摆在人们面前的需要亟待解决的问题,“语义清晰”是大规模图像数据管理的重要前提,因此图像语义自动标注的研究成为了相关领域的研究热点。   图像语义的自动标注本质上是一个学习问题,即根据图像的视觉内容推导出图像的语义标签。因此,各种机器学习、统计推理技术都应用于图像标注的研究中,并在不断的深化和推进。然而,由于图像标注中“语义鸿沟”以及“多标签”问题的影响,现有方法的标注性能仍有待进一步提高。   本文围绕图像标注的多标签特点,集中利用多标签的相关性和共现性知识,针对多标签特性带来的数据稀疏、噪声数据集以及语义多标签的无序性等问题开展研究,在多标签数据集的转化、语义多标签的排序、图像语义自动标注系统等方面进行了新的尝试,并取得了一定的效果。   本文主要工作如下:   (1)提出了一种新的多标签数据集转化方法RAPC-W:针对现有多标签数据集转化方法无法有效利用标签间的语义相关性和共现性知识以及转化后得到的数据集存在数据稀疏和噪声数据集的问题,提出了一种新的多标签数据集转化方法RAPC-W(RankingByAllPairwiseComparisionBasedWordNet),该方法将标签对从原始的两对扩展到四对,增加了划分后数据集的规模。另外,引入了外部数据源WordNet,较好地考虑了标签语义相关性和共现性知识,一定程度上过滤掉了语义不相关的标签组合,更好的保留了原始数据集的信息,降低了噪声数据集对基分类器训练的不良影响。实验结果表明该方法是有效可行的。   (2)提出了一种新的语义多标签排序算法:语义标签的排序结果也是图像语义自动标注结果正确与否的重要参考指标,针对当下图像语义自动标注中语义标签排序不准确的问题,提出了一种新的多标签排序算法,该算法利用判别分类技术中用到的基分类器,根据划分后数据集的规模给予每一个基分类器一定的权值,最后利用该权值对每个基分类器输出的语义标注结果进行投票,从而实现对语义标签的排序。最终实验结果表明该方法是有效的。   (3)设计实现了一个图像语义自动标注系统:语义自动标注技术的研究在多媒体数据管理领域具有十分重要的理论意义与应用前景。为了充分展示本文所提方法的标注性能及其应用价值。本文在以上所提两个算法的基础上,参照多马尔可夫随机场的图像语义自动标注模型(MultipleMarkovRandomField,MMRF),设计并实现了一个图像语义自动标注系统,通过交互式的图像语义标注模型的训练与标注演示,充分展示了该标注系统优越的标注性能。
其他文献
随着异构数据的急剧增加,云计算应运而生。作为云计算的编程模型MapReduce同样也得到了广泛的关注,特别是在学术界。为了解决覆盖及中间数据的存储等诸多问题,诸多学者提出了
中文文本相似度计算是中文信息处理相关研究领域中的重要基础,在信息检索、知识挖掘、舆情分析等领域中有着广泛应用。目前的中文文本相似度计算方法大多是从文本的字形层面而
随着网络和电子商务的普及,支付问题日益受到人们的重视。通过对支付模式和策略进行研究,发现其中存在信息泄露、客户端不安全、处理流程复杂和认证繁琐等问题。在支付过程中,安
随着军事通信技术的日新月异,现代战争战场通信系统日益复杂,伴随我军通信系统的快速发展,建设高效、畅通、合成的战场通信网络是我军通信发展的客观需要。战场军事通信网仿真研
Web服务是一种面向服务架构的技术,通过标准的Web服务协议提供服务,保证不同平台的应用服务可以相互操作。Web服务作为一种新型的分布式构件模型已经在电子商务、企业应用集成
随着智能视频监控系统的高速发展,近年来,人们对视频监控系统的智能性要求日益提高。多摄像机网络能够监控更广阔的区域,正在逐渐被重视。但是,从经济、资源等方面的考虑,不太可能
近年来,随着无线移动通信技术的迅猛发展,第三代移动通信系统已经得到应用,第四代移动通信系统逐渐成为学术界和工业界关注的热点。第四代移动通信系统是一个多种通信系统的综合
我国于2013年初确定了第一批智慧城市试点名单,这也预示着我国城市的发展和规划开始由原来的数字化城市向更高的形态转变,即智慧城市。智慧城市是利用信息和通信技术使城市更
长期以来,对断路器热脱扣测试一直停滞在手工测量的阶段。其每项性能参数根据试验的基本原理,用传统仪器或专用测试仪器来测量。这种试验方法从结构来看,一般为分立的专用仪器;从使用方式来看,以手工操作、人工读数为主,人工计算为辅;从数据管理的角度来看,无法同时处理大量的数据,没有数据库保存测试的各项参数,无法对以前的测试数据进行比较、汇总等工作;从查找故障的角度看,无法快速准确地找到故障原因和位置;从安全
随着网络和信息化建设的不断发展,局域网设备的数量越来越多,如何保证这些设备的正确运行,出现故障如何第一时间得到通知,准确定位问题所在,并迅速解决问题,这些方面都需要着重考虑