结合全局观测值的图像区域语义自动标注研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户：yaer7201982

【摘要】

：

随着互联网技术的快速发展和社交网站的广泛应用，互联网上的图像和视频的数量以前所未有的速度增长。与文字相比，图像往往包含了更为丰富的信息，因此对于图像信息的挖掘和探索一

【作者】

：

林哲

【机构】

：

复旦大学

【出处】

：

复旦大学

【发表日期】

：

2014年期

【关键词】

：

图像信息区域语义自动标注全局观测值条件随机场

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术的快速发展和社交网站的广泛应用，互联网上的图像和视频的数量以前所未有的速度增长。与文字相比，图像往往包含了更为丰富的信息，因此对于图像信息的挖掘和探索一直是计算机科学研究的一个重要的课题。为了在海量的图像里进行有效地检索和管理，图像一般都被标注了语义标签。图像自动标注研究(Automatic Image Annotation，AIA)是研究如何自动地根据图像的内容，将与其相关的语义标签赋给图像。在过去几年的研究中，很多与图像自动标注相关的方法被提出，并取得了很大的进展。然而，图像标注仅仅是标注了相关的物体是否在图像里出现，并没有具体地标明物体出现在图像当中的位置。因此，对图像的像素或区域进行语义标注的研究吸引了学术界越来越多的关注。　　图像区域的自动标注就是根据图像区域的视觉内容，将一个与其相关的语义标签赋给它。一个有效的方法是在对图像区域进行标注的时候利用空间上下文信息，即考察相邻区域的标签和视觉内容。通常情况下，相邻的图像区域或像素往往具有相同的语义标签，这被称作“标签平滑性”。利用图像区域在空间上的平滑性，图像区域标注的效果有了明显的提升。但是，图像的局部区域通常具有有限和模糊的视觉内容。与图像的区域相比，图像整体的观测信息具有更为丰富和清晰的观测信息，这被称作“全局观测值”。对于图像的局部观测值来说，图像的全局观测值是一个有效的补充。　　本文提出了一个基于条件随机场（Conditional Random Fields，CRF）的标注模型，结合图像局部观测值和全局观测值，同时将语义上下文建模融合到模型当中，通过利用不同尺度的图像观测信息和语义标签之间的相关关系来提高标注的效果。条件随机场能够有效地利用图像局部的观测信息，图像全局观测值的引入则是对局部观测值一个有效的补充，弥补了图像局部的视觉信息的不足。在图像当中，很多语义标签往往会同时出现，这些语义标签具有相关性。图像标注的相关研究表明，语义上下文关系的利用能有效地提高图像标注的效果。在引入图像全局观测的同时，我们也对图像级别语义上下文关系进行建模，进一步提高对图像全局观测值的挖掘利用效果。在条件随机场框架下，图像局部观测值和全局观测值的参数能够通过标准参数学习方法得到。　　我们在两个公用数据集——MSRC数据集和Corel数据集——上进行了系统的实验，验证了本文提出的条件随机场(CRF)模型的标注性能。从实验的结果可以看出，本文提出的模型比目前较先进的标注模型在标注准确性上有了明显地提高。实验证明了模型的性能提升来自与局部观测值和全局观测值的结合.，而不是来某一种单一一种方法。实验同时证明了在引入图像全局观测值的基础上进行语义上下文建模，模型的性能有了进一步的提高。

其他文献

基于IPSec VPN的网关的设计与实现

所谓VPN(Virtual Private Network,虚拟专用网络)是指通过公用骨干网联接,利用隧道协议和安全措施构建的专用网络,这里的公用网主要指Interet。为了保障信息在Internet上传输

学位

VPNIPSecAHESP隧道加密认证IKEDDNSNAT

可视化数据挖掘在交通事故新闻分析中的应用

数据挖掘作为一门学科，汇聚了数据库、人工智能、统计学、可视化、并行计算等不同学科和领域，受到各界的广泛关注。目前，就国内来说，虽然数据挖掘技术本身已经逐步趋向成熟，而且从

学位

可视化数据挖掘道路交通交通事故新闻分析

面向信息搜索的混合式查询扩展技术研究

学位

多核系统上可伸缩的读写同步

随着计算机硬件技术的飞速发展,单个处理器性能的增长已经遇到了瓶颈,处理器个数的增长成为了提高单个计算机性能的主要发展方向。处理器个数的增长给应用程序的性能提升带来

学位

多核系统性能可伸缩性读写同步

软构件系统的演化模型研究

软件复用是当前软件工程研究的重要问题之一，被认为是解决软件危机的有效途径。近年来，面向对象的构件化软件技术蓬勃发展，国际上出现了像CORBA，COM，EJB等构建构件系统的标准和技

学位

构件演化模型CBSDSOA

基于角色的带多约束特性访问控制模型研究与实践

访问控制是信息系统安全的重要方面,也是近年来国内外研究的热点。特别是基于角色(Role-Based Access Control:RBAC)的访问控制机制,更是企业级应用的核心。基于角色访问控制

学位

基于角色的访问控制角色集时间约束授权授权约束角色语境基于角色的带多约束特性访问控制模型

工作流技术在高校OA系统中的应用研究

　　本文基于中山大学软件学院副院长常会友教授提出的办公自动化系统设计方案，对广东警官学院办公自动化系统进行了深入研究和开发。论文中主要通过对工作流技术、工作流管理

学位

办公自动化工作流技术工作流管理模型高校OA系统

基于WEB的虚拟会展系统

鉴于会展业对经济发展和社会生活带来的影响越来越巨大，政府也已经越来越关注会展业和会展经济。如何扩大会展影响力，降低展会成本，提高办展效率，展会的信息化是一个重要的研究方

学位

会展经济网络服务虚拟会展系统信息管理

图像搜索引擎中信息采集技术的研究

随着Internet规模的迅速增长,网上的信息资源也迅速增长。这使得用户在网上迅速、准确地获得所需信息变得越来越困难。因此,改善传统的信息采集和搜索模式,使用户能更迅速准

学位

搜索引擎网络爬虫移动AgentWeb信息采集

手机风格评价系统

工业设计的主要的目的是在于设计出可以满足消费者所需要的产品，来改善生活品质。当市场上产品不断的推陈出新，企业为了不被市场淘汰，必须面对消费者各种各样的偏好需求，设计出符

学位

工业设计手机风格感性工学系统消费者产品评价

结合全局观测值的图像区域语义自动标注研究

与本文相关的学术论文