基于Web的图像自动标注方法

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:wp87825385
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于内容的图像检索存在图像原始的底层特征与用户抽象的深层语义之间的“语义鸿沟”,目前缩小“语义鸿沟”的方法还不够理想。随着Web2.0的发展,越来越多的互联网用户在向互联网上传图片时,同时会附加相应的文本信息对图片予以描述或说明。这些信息对于分析图像的语义内容、挖掘图像检索用户意图具有重要作用。以往研究者主要偏重从机器学习的角度对图像自动标注进行研究,对于如何有效利用这些信息并没有给予充分的考虑与重视。基于机器学习的图片自动标注方法需要大量的参数优化与复杂的学习过程,不能快速的对大量网络图片进行有效的标注,基于此本文设计并实现了基于Web的图像自动标注方法。该方法首先利用图像的文本化表示对图像进行特征提取;然后使用图像检索技术,检索出与要标注的图像相似的图像列表;通过对这些图像的周围文本信息进行综合处理,最后挖掘出待标注图像丰富的语义标注。本文的主要贡献概括为如下几部分:(1)首先,通过使用图像处理技术和快速流式K-means聚类算法,实现图像的文本化表示,将文本领域的方法应用到图像处理中,从而简化图像检索与处理时的工作。(2)再次,为有效的分析基于机器学习的图像自动标注方法的特点,在图像文本化的基础上,实现两种当前效果较好的多类标分类方法MLKNN和MFoM。在此基础上分析基于机器学习的图像自动标注方法的优缺点。(3)最后,为克服基于机器学习的图像自动标注方法的缺点,解决快速增长的互联网图片的自动标注问题。本文通过利用互联网图片的周围文本信息对图像进行有效的语义标注,设计并实现了基于Web的图像语义自动标注方法的整体架构以及详细算法。该方法综合利用图像的文本化表示、基于内容的图像检索方式以及自然语言处理技术对图像进行自动标注。实验结果表明,当图像数据规模较大、图片语义标签较多的情况下,基于Web的图像自动标注方法在准确率和召回率方面,都明显优于基于机器学习的图像自动标注方法。该方法不需要大量的参数优化和复杂的学习过程,避免对训练集进行大量的人工标注过程,能够从相对“稀少”的图像标签中挖掘出相对丰富的语义内容。
其他文献
网络论坛(BBS)由许多讨论不同话题的帖子构成,蕴含着丰富的有价值的信息,已经成为当今互联网的一个重要的舆论信息传播渠道。在BBS中,参与回帖的网民可能会由于对同一话题的意见或
随着空间数据库在实际应用领域的广泛发展,空间查询中的最近邻查询及其变体查询研究成为热点问题。已有的最近邻查询已经不能满足广泛的应用需求,为此最近邻查询研究的数据环
近年来,随着我国经济高速发展和高校办学规模的扩大,高校经费来源由过去单一的国家财政拨款,逐渐转变为以财政拨款为主,多渠道筹措教育经费的多元化格局。同时,学校财务业务
无线传感器网络近年来发展迅速,它综合了多个学科的相关技术,能够对各种环境进行连续地监测,在环境,军事,医疗等许多领域具有巨大的应用潜力。在实际应用中,节点的位置坐标很重要,缺
随着互联网技术逐步发展,网络安全问题日益严峻,围绕着反编译技术,逆向工程以及嵌入式驱动理论的各种病毒,木马以及流氓软件给网络用户的个人隐私,财产安全都带来的严重的威
在当前分布式互斥请求集生成算法研究中存在算法的对称性和请求集长度不协调,时间复杂度、空间复杂度与请求集长度不能兼顾的问题,为了解决上述问题本文主要从以下三个方面进
近年来软件开发技术不断成熟完善,分布式软件在医疗,交通,军事等许多重要领域扮演着越来越重要的角色。由于分布式软件自身规模大,软件复杂度高,开放性强的特点,在其被广泛运用的同
随着互联网的快速发展,网络上的信息量变得极其庞大,而作为Web1.0时代就已经出现的传统应用,网络新闻仍然有着很高的使用率。为了方便用户有效地发现自己想要的信息,需要对新闻报
汉语词汇中歧义词的出现给语言的使用带来了很大的变化和便捷,但同时也给自然语言的理解带来了很大困难。词义消歧的工作就是设法确定歧义词在特定语境下的语义。自然语言处
计算机与网络技术的发展,使图像等多媒体资源在互联网广泛传播,也因此带来了版权保护、内容认证等一系列安全问题。本文以图像为基础,对内容相关水印技术进行研究,提出了若干新型