基于区域特征的有监督图像语义标注

来源 :苏州大学 | 被引量 : 0次 | 上传用户:randomx1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字图像以及图像数据库数量的快速增长,图像检索已成为信息检索领域中的一个重要研究方向,它的目的是从图像数据库中快速提取出与查询相关的图像或者图像序列,使用户能迅速获取需要的特定图像。基于内容的图像检索建立在对图像底层特征的提取和分析、匹配的基础之上,无法解决图像底层特征与高层的语义概念表达之间存在着巨大的差异的问题,即“语义鸿沟”的问题。因而图像语义检索成为了图像检索技术研究的热点。基于语义的图像标注是基于语义的图像检索的关键组成部分。本论文详细阐述了图像标注的发展历程,并提出了几种基于区域特征的有监督图像语义标注算法。本文的主要贡献在以下几点:首先,提出一种改进的基于高斯混合模型的有监督图像语义标注方法。该方法主要包括图像分割(J-value segmentation, JSEG)、底层颜色和纹理特征的提取、利用期望最大化(Expectation Maximization, EM)算法训练基于高斯混合模型的概念分类器、去除噪声区域更新概念分类器和对测试图像进行语义概念标注等步骤。对于每一个概念均获得两个基于高斯混合模型的分类器,即颜色分类器和纹理分类器,并结合去除与概念无关的噪声区域的方法更新概念分类器,在标注阶段采取决策级融合技术。在Trecvid2005视频图像库上的实验证明,利用本文算法获得的标注结果较传统的对每一个概念都建立一个概念分类器的方法所得的图像标注性能有较大的提高。其次,提出一种基于区域间关系的有监督图像语义标注方法。图像的某一语义概念往往与图像的许多区域特征有关系,这些区域间也存在着语义相关性,因而本方法在对测试图像进行语义标注时,提出了考虑测试图像区域间相关性的算法,且通过在Trecvid2005视频库和Corel5K库上的实验证明了该算法的可靠性和有效性。另外也分析比较了图像均匀分割和JSEG分割算法,使用均匀分割代替JSEG分割,并结合考虑图像区域之间相关性的方法,进一步提高了图像的语义标注性能。
其他文献
易混淆语音是指那些具有相似发音机理,在听觉上容易混淆,容易被系统误识的语音单元。众所周知,随着语音识别算法的日趋成熟,易混淆语音的存在成为影响语音识别率的重要因素之一。
期刊
通信技术的研究有两大方向:一是光纤通信技术的发展,主要表现在单通道光信号传输速度的不断提高和可重构光网络技术方面;二是无线技术的进步,主要表现在新频段的开发和新物理层
以太网(Ethernet)是一种计算机局域网组网技术,它是当前应用最普遍的局域网技术,在很大程度上取代了其它局域网标准。V.35接口是一种高速同步数据接口,用于6O~108kHz基群电路
近些年来,计算机技术、嵌入式技术、通信技术、视频压缩技术的飞速发展,为基于嵌入式流媒体技术的应用提供了广阔的空间。稳定的网络流媒体系统需要解决视/音频编解码、网络
H.264是由ISO/IEC与ITU-T组成的联合视频组(JV7)制定的新一代面向未来IP和无线环境下的视频压缩标准,它在视频压缩效率方面比目前其它的视频压缩标准都要高,但是H.264也具有
老鹰等动物能快速、准确地从复杂背景中捕获和跟踪猎物的能力一直是智能跟踪系统发展和追求的目标。通过仿生动物视觉神经信息处理系统实现复杂背景下的运动目标检测与跟踪,
近年来,随着各种高速、超高速飞行器的问世,传统的雷达探测技术面临着严峻挑战,因而对高速目标的检测方法展开研究具有十分重要的意义。脉冲多普勒雷达通常采用长时间积累方
单载波块传输技术是类似于OFDM的高效传输技术。它一方面具有OFDM分块传输、分块处理的特征,另一方面具有单载波传输系统低峰均功率比的优势,同时接收端用复杂度较低的频域均
随着通信技术、嵌入式技术、微机电系统、传感器技术的迅速发展,具有一定感知能力、计算能力和通信能力的无线传感器开始出现。无线传感器网络(WSN)能够协作地实时监测、感知