基于潜在语义的Web图像标注

来源 :南京大学 | 被引量 : 0次 | 上传用户：lingliang416

【摘要】

：

自从上世纪70年代以来，图像发现就获得了广泛的研究，并经历了基于文本的图像数据库和基于图像视觉内容的检索两个研究阶段。但由于基于文本的图像数据库，采用图像信息手工标注，效

【作者】

：

卢超

【机构】

：

南京大学

【出处】

：

南京大学

【发表日期】

：

2003年期

【关键词】

：

图像数据库 Web图像图像发现潜在语义自动标注文本标注

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

自从上世纪70年代以来，图像发现就获得了广泛的研究，并经历了基于文本的图像数据库和基于图像视觉内容的检索两个研究阶段。但由于基于文本的图像数据库，采用图像信息手工标注，效率低下，主观随意；而基于图像视觉内容的检索技术，又难于跨越视觉特征到图像含义的语义鸿沟，因而实际应用的效果都不是非常理想。在这种情况下，基于语义的图像发现成为了最新的研究趋势。相应的，文本标注作为一种最简单，有效的图像语义表达方式成为了基于语义的图像发现一个重要的研究分支。目前的图像标注技术主要有手工标注，半自动标注和自动标注。手工标注效率低，难以满足Internet这样大规模图像集的标注需求；半自动标注过于依赖于用户的反馈信息，同样也不适应Internet图像发现这样一个多用户的环境；对Internet图像发现而言，Web页面的提供者在提供图像的同时，也使用超文本(HTML)为Web图像提供了一个网络中的异常丰富的文本语义的外部环境，从Internet外部环境中自动抽取出Web图像的文本标注信息，这样一种自动标注技术高效，稳定，非常适用于Internet图像发现。但当前的Web图像自动标注技术，对Internet环境下图像的文本语义信息缺乏一个系统的模型表示。而且目前的标注技术一般使用VSM方法，这种方法只能提供词条级的信息发现，不能提供更高层的语义级的发现，因而标注精度并不理想，而Internet环境下，图像标注信息少，用户查询平均长度短，这些都对图像标注技术的精度提出了更高的要求。正是在以上研究的基础上，本文通过引入潜在语义分析(LatentSemanticAnalyzes)这一新的信息发现工具，进行Web图像的自动文本标注。一方面，通过对Web图像上下文文本语义的自动抽取，标注，大大提高了图像标注的效率和准确率。另一方面，相比传统的VSM(向量空间模型)而言，LSA可以将高维的特征空间映射到低维的潜在语义空间上，从而提供更高的标注和检索精度，支持用户在概念层次上的查询，并且能提供更好的相关反馈的支持。本文的研究成果如下：分析了图像发现的两条不同的研究路线。讨论了图像检索技术的发展情况，指出了图像发现系统当前所面临的难题，及发展的趋势：基于语义的图像发现。研究了面向Internet的图像语义发现中的一个重要的研究课题——图像语义标注的当前研究状况，并提出了一种新的研究思路：Web图像潜在语义标注。研究了潜在语义分析技术的线性代数理论基础，分析了潜在语义索引的5项关键技术：SVD(singularvaluedecomposition)，查询表示，匹配算法，特征加入，索引重构。介绍了该模型在信息发现方面的成功应用，讨论了将潜在语义分析应用于Web图像发现的可行性及优点。给出基于染色图的Web图像的理论模型，并在此基础上研究了图像在Web中的上下文语义信息表示模型WICI，给出了相应了自动抽取算法。研究了基于潜在语义分析的Web图像标注方案，并给出了相应的图像发现模型(WILSA)，进一步研究了基于潜在语义模型的相关反馈技术。设计了一个基于潜在语义分析的Web图像发现实验系统ImageHunter。给出了ImageHunter的体系结构及各个部分的定义及实现。探讨了ImageHunter实现中的若干核心技术，并在此系统上进行了实验，验证潜在语义分析模型应用于Web图像标注/发现的效果。

其他文献

生物免疫思想在计算机安全中的应用

计算机安全问题是计算机科学中一个非常重要的研究课题,由于新的入侵方式、技术不断出现,传统的安全技术已经远远不能满足社会应用的需要.生物免疫系统保护生物免受各种病菌

学位

生物免疫系统检测代理计算机安全

XQuery的扩展及XML文档更新方法的研究

XML正在迅速成为Web上用于表示和传递数据的主要技术之一。在过去几年的发展中，XML的角色已不再仅限于联机文档保存语义的标记语言，而逐渐成为异构系统间交换数据事实上的标准

学位

XML查询语言XMLXQueryXML文档结构一致性XML更新操作

SCORM规范的研究、改进和远程教育平台的实现

SCORM规范为建立一个远程教育平台提供了一种标准,本规范为学习对象定义了一个基于Web页面的"内容管理模型"和"运行时环境".遵守本规范的设计的课件可以在任何严格实现本规范

学位

SCORM技术标准内容聚合模型平台系统远程教育XML元数据安全

基于Windows DNA的医院物资管理系统的可扩展设计与实现

近年来,随着网络技术的发展,分布式计算的普及,医院信息系统(Hospital Information System,简称HIS)的相关技术和方法也发生了很大的变化.由最初的单机模式发展到客户机/服务

学位

Windows DNA体系结构三层服务模型医院物资管理系统

基于SSE2指令集的H.265/HEVC分像素插值优化

多媒体技术中的基础和核心技术都是视频编码技术。自从上个世纪90年代第一个视频编解码标准被制定以来，国际上已经制定了许多视频编码标准，但从其发展历程来看，它的目的始终是为

学位

分像素插值视频编码H.265/HEVCSSE2

基于XML/Java模型的商务信息管理系统的设计与研究

商务信息管理系统属于数据密集型应用,这一领域面临的共同问题就是存储和管理大量的、持久的、共享的数据.这就迫切的需要为用户设计一个管理这些纷繁的商务数据的系统.本文

学位

XML/Java模式Web三层体系结构商务信息管理系统商业决策负载均衡

基于组件技术的WEBGIS的研究与实现

地理信息系统(GIS)正在逐渐深入到各个领域中,而计算机网络的迅速普及加快了传统GIS向网络GIS迈进的步伐,GIS与网络技术的结合是当前GIS研究领域的重要方向,构造分布式地理信

学位

地理信息系统WEBGIS分布式计算模型组件技术

入侵检测系统中的进程通信方法研究

该文详细讨论了机内进程之间和不同机器上的进程之间的通信方法和实现细节,对改进入侵检测系统各组成部分之间的通信性能具有很大意义.对于机内进程间通信,该文介绍了实现机

学位

入侵检测系统进程通信以太网Linux操作系统通信协议

基于SAN的多视频服务器下的素材管理与调度

作者充分研究了现有的SONY,PINNACLE,GVG等流行的视频服务器以及其组网方式,通过对以往几种模型的比较,结合国内电视台的播出需求,提出了新的存域网组网方案,建立了一种有效

学位

存域网视频服务器调度存储安全性数据库接口

基于GIS的数字矿井图形系统研究与设计

该文分析了构建矿井图形系统的数据来源、数据分类以及数据特征.在完成基于底图数字化的数据采集系统设计的基础上,研究了利用原始数据和底图数字化数据自动生成矿井图形的方

学位

地理信息系统GIS矿井图形系统数据采集体系结构

基于潜在语义的Web图像标注

与本文相关的学术论文