【摘 要】
:
自动图像标注是解决人工标注问题的具有挑战性的工作,它试图在高层语义特征和底层视觉特征之间建立一座桥梁。特别随着机器学习理论的不断发展,很多学者设计出了不同的学习模
论文部分内容阅读
自动图像标注是解决人工标注问题的具有挑战性的工作,它试图在高层语义特征和底层视觉特征之间建立一座桥梁。特别随着机器学习理论的不断发展,很多学者设计出了不同的学习模型,大致可分为两类,即基于概率建模的图像标注和基于分类器的图像标注。本文首先研究两种具有代表性的基于概率建模的标注算法,分别是共现模型和翻译模型。共现模型将图像划分成规则区域,根据图像区域和关键词的共现概率来标注图像,即观察关键词与图像区域的联合发生概率。翻译模型改进了共现模型,提供一种描述图像的新概念——视觉词元。视觉词元通过图像特征聚类后得到,那么每幅图像都包含一个视觉词元集合,图像标注可以看作是从视觉词元“翻译”成为关键词的过程。结合共现模型和翻译模型的思想,本文设计了一种改进相关模型。假设有一个已标注的训练图像集合,通过图像划分聚类后可获得其视觉词元集合,那么每幅图片就可以用视觉词元和关键字两个集合联合表示。再给定一个测试图像,使用语言生成模型方法假设存在一个潜在的概率分布,即相关模型,其包含所有可能出现在图像中的关键词和视觉词元,那么标注过程就是对这个概率分布进行随机抽样。通过训练集可以近似估计这个联合分布,再通过抽样概率值大小提取最有代表性的关键词作为图像的标注结果。这种改进相关模型技术可以有效地利用大规模的带标注的训练图像集,达到更好的标注效果。最后,在Corel数据集上的实验证实了该模型的有效性。
其他文献
西太平洋暖池(Western Pacific warm pool)是全球海温最高的海域,汇聚了巨大的热能,在地球气候系统中具有非常重要的作用。本文综述了近30年来有关西太平洋暖池的研究进展,包
随着计算机技术的迅猛发展,应用高性能计算和一些新的算法进行分子模拟的研究已经成为一个新的研究方向。耗散分子动力学(DissipativeParticle Dynamic DPD)作为一种分子模拟
从噪声图像中提取目标结构的轮廓是计算机视觉中的一个基本问题。为了解决这一问题,研究者提出了轮廓编组的理论。轮廓编组可以用来在噪声图像中识别显著结构,在许多高级视觉
电阻抗成像技术(Electrical Impedance Tomography,简称EIT)是一种可视化、非侵入、低成本、无辐射的检测技术,已成为工业检测和医学检测领域的研究热点。随着电子技术的不断发
图像超分辨率技术是指人们通过软件的手段从一幅或多幅相关的低分辨率观测图像中重建出高分辨率图像的过程。该技术最初应用在医学、航天等相关领域,但随着人们对高分辨率图
常用的遥感图像融合方法,如IHS变换法、Brovey变换法和主成分变换法等在实施图像融合时,均会有不同程度的光谱扭曲现象。探讨能有效保持光谱信息的EECN融合法。EECN融合法采
2009年10月,中国因特网信息中心发布的报告显示:截至2009年9月底,中国网民规模达到3.38亿。这样2009年中国上网人数就比美国总人口总数还要多,网民绝对数量居全球第一。但IPv4
增强现实(Augmented Reality, AR)是一种将计算机产生的虚拟物体或信息与真实环境进行合成并对景象加以增强或扩充的技术。文中介绍了增强现实的基本概念、主要应用及研究现
产品信息模型是协同设计过程控制与管理的基础。它是用以表达协同设计对象的结构、组织、约束及属性的功能体。由于在协同设计中,不同领域的设计群组人员所具有的领域知识不同,在产品设计过程中,会对产品的概念产生歧义性,引起设计的冲突。如何构建统一完备的产品信息模型,已经成为协同设计的首要任务。目前对于产品信息的建模均是基于语法层面的描述,无法表达基于语义层面的信息要素。而本体论以其良好的语义表达能力和具有对
随着计算机技术的高速发展,计算机系统已经广泛运用于水务行业的各个方面,经过多年的运行,水务行业在各个业务系统存放了大量的历史数据。如何利用这些“沉睡”的数据进行数