基于上下文信息的Web图像标注研究

来源 :武汉理工大学 | 被引量 : 1次 | 上传用户:wanyu123456
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
计算机技术的飞速发展,开启了人类社会的信息化时代,互联网在人们的工作、学习以及生活中逐渐占据了重要地位。目前,互联网中已经积累了庞大的信息,并一直保持着快速增长的趋势。与此同时,随着多媒体技术的发展,数据的描述及传播形式日益丰富,趋于多样化,除了原先单一的文字信息,其他形式的数据,如图像、视频等逐渐成为互联网中信息传播的主流。图像具有生动形象、易于理解的特点,能够直观、快速地将表达的信息传递给用户,既可以作为独立的数据形式存在,又能够与其他类型的数据相互补充,这些特点,使图像成为了互联网数据的主要形式。Web图像,即在Web页面中的图像,处于互联网环境中,由发布者嵌入Web页面中展示给用户。研究发现,除了Web图像本身具有的视觉特征外,图像所处的Web页面中还伴有丰富的外部信息,即Web图像上下文信息。这些上下文信息在一定程度上揭示了Web图像的主题,对Web图像自动标注具有重要意义。本文主要研究Web图像自动标注的方法,充分利用Web图像视觉特征及所在Web页面中丰富的上下文信息,自动为Web图像添加标注信息。本文对Web图像特征提取、融合,以及标注方案的研究,有助于提升标注性能,构建良好的Web图像描述机制,为用户在海量的互联网数据中更准确地检索到目标图像奠定基础,对多媒体领域图像检索的研究具有较大的意义。主要研究工作和创新如下:(1)采用了基于AHP的上下文信息权重分析方法。本文首先对存在于Web页面中的Web图像上下文信息的类型进行研究,并针对不同的类型语义贡献度的差异性问题,提出了基于AHP的上下文信息权重分析方法,计算出不同类型的Web图像上下文信息的权重。(2)给出了基于权重的文本特征提取方案。不同于常规的文本特征提取过程,本文在(1)中工作的基础上,采用了基于权重的文本特征提取方案,此方案中主要使用了基于权重的TF-IDF算法,对中文分词后的关键词权重进行计算,最终选取权重较高的关键词作为Web图像的文本特征。(3)采用基于LDA的主题语义生成方法获取Web图像的主题和语义特征。本文中Web图像语义特征来自于其所属主题的语义特征,通过对图像视觉特征类型的研究,选取SIFT特征作为训练集图像底层特征,并通过聚类,生成图像视觉词袋模型;随后,使用LDA模型对图像视觉词语集进行训练,最终生成图像主题及其语义特征。(4)提出了基于PageRank的多特征融合方案。Web图像相关信息主要包含文本信息和视觉信息,都可以作为Web图像标注信息的来源。本文考虑到Web图像两种相关信息之间存在的异构性,提出了基于PageRank的多特征融合方案对Web图像文本特征和语义特征进行融合,其中,Web图像文本特征取自文本信息,语义特征取自视觉信息。(5)给出了Web图像自动标注方案。本文研究了图像自动标注的基本框架,并结合Web图像自动标注自身的独特性,给出了Web图像自动标注方案,并基于此方案实现了Web图像自动标注原型系统。本文基于实验数据集,对上述工作中提出的算法进行了实验对比,实验结果验证了本文提出的Web图像自动标注方案的有效性。
其他文献
1研究目的四年一届的全国体育科学大会较全面地反映了不同阶段体育科研成果,本文以第五至九届全国体育科学大会入选论文为视角,以探求全国体育科研发展的特点和趋向为目的。2
撰写本文的目的是为了研究陕西省女足青年队传球失误的原因,通过对所得出的结果进行分析研究希望能对陕西省女足青年队成绩的提高有所帮助。采用数理统计法、录像观察法、逻
作为一种新型的短距离无线通信方式,可见光通信(Visible Light Communication,VLC)以其潜在的超高速传输能力而有望在未来成为现有无线射频通信技术的有效补充。然而,鉴于当
数字图像取证技术是多媒体信息安全领域中的一个重要研究方向,对于基于图像格式的数字图像取证的研究,主要针对的就是JPEG压缩图像。双重JPEG压缩指的是一幅数字图像先后经过
与传统城镇化相比,新型城镇化坚持以人为本,将人的发展与城镇经济社会发展相协调,为人的全面发展提供了巨大的历史机遇。中国持续了近20年的2亿人口的流动加速了农村人口的城
近年来,人工智能技术的进步对经济增长产生重大影响,极大改变人类生产和生活方式。在新一轮工业革命的浪潮中,智能化产业将成为经济发展的新引擎及促进传统产业转型升级的重要抓手。目前来说,中国亟需人工智能新技术来促进中国的产业变革和生产率的提升。众所周知,当今世界人工智能作为新工业革命的核心技术之一,可以带来巨大的经济效益和社会效益,将进一步加速技术进步,进而促进生产率的提高。研究人工智能发展对我国产业全
相比于传统智能功率模块,单片智能功率芯片具有更低损耗、更小体积及更丰富的控制与保护功能,广泛应用于各类电机驱动和电源应用中。SOI-LIGBT(Silicon-On-Insulator Lateral
竞技健美操具有难、新、稳、美、力、准、齐、高等的显著特征,是难美项群项目制胜最为关键的因素,而在单人竞技健美操中难、新、稳、美、力是其制胜的主要因素。竞技健美操中
在我国高等教育新时期、新阶段、新常态发展的背景下,应用技术型高校成为一种融合高等教育、职业教育、继续教育为一体的新类型,主要培养高层次技术技能人才,将引领现代职业
美国黑人小说发展至今,已有两百多年的历史,是美国文学不可或缺的一部分,早在20世纪20年代,美国黑人小说就开始译入中国,在中国经历了漫长的译介历程,是中国翻译文学史不可忽视的重要组成部分。然而,迄今为止,对美国黑人小说在中国的译介研究还不够系统,不够全面。因此,本文尝试对美国黑人小说在中国的译介进行专题研究,旨在回答以下问题:美国黑人小说在中国的翻译受到哪些因素的影响?美国黑人小说的翻译在不同时期