互联网图像高效标注和解译的关键技术研究

被引量 : 0次 | 上传用户:illuminate
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
作为支持互联网大规模图像检索的一种有效和实用方法,互联网图像自动标注和理解已成为学术界和产业界的热点问题而被深入研究。本文研究了图像视觉内容与伴随文本语义之间的潜在关联关系挖掘、图像解译、大规模数据聚类以及图像视觉特征深度学习等关键性问题。论文的主要工作有:一、提出了一种基于数据驱动的互联网图像自动标注和理解框架(Automatic Web Image Annotation and Interpretation, AWIAI)。在图像自动标注过程中,AWIAI框架先计算图像伴随文本中单词可见度属性来构建“图像-单词”关系矩阵,然后对该关系矩阵进行隐性文法分析以扩展备选标注单词,最后通过图像视觉内容的无监督学习和对单词两两共生关系进行分析和排序,得到图像标注最终结果。二、在图像自动标注结果的基础上,提出了图像解译的概念和具体实现方法。现有图像自动标注方法未能对标注单词之间存在的语法关系进行分析,因此得到的图像标注结果是若干离散单词,难以对图像所蕴含丰富语义进行自然语言的深层次描绘(如对图像产生“熊猫吃竹子”的分析结果)。该方法在AWIAI框架下得到图像标注单词后,分析标注单词之间的语句关系,产生句法群组,以自然语言方式对目标图像内容进行解译。三、对存在致密相似度关系的大规模数据,本文针对性提出了两种改进的近邻传播聚类的方法,即在聚类过程中通过局部信息传递来加快整体信息传递速度的方法,以及通过对局部采样数据进行信息传递,再将其它数据内嵌进去从而得到快速全局近似结果的方法。AWIAI框架以数据驱动为核心进行图像智能处理,因此需要解决大规模数据高效聚类这一难点问题。四、在AWIAI的图像理解过程中,本文提出了一种结合模型和数据驱动的深度学习方法(Deep Model-based and Data-driven, DMD)来提取图像理解中最具区别性的视觉特征。近来神经科学理论研究成果认为大脑对外界视觉信息感知是一个逐层学习过程。DMD方法通过一个从简单到复杂的深度学习流程来提取图像视觉特征,先以无监督学习方法获得特征并将其稀疏化,然后通过有监督学习方法实现图像语义理解和标注。
其他文献
构建社会主义和谐社会,是中共十六届四中全会根据我国经济社会发展的新要求和我国社会出现的新趋势、新特点提出的新理论,并且把和谐社会建设放在同经济建设、政治建设、文化
大学生社会实践是具有中国特色的高等教育的重要组成部分,是对大学生进行思想政治教育的重要途径。它是融学校教育、社会教育和自我教育为一种的教育形式。社会实践对于促进
随着教育逐步成为衡量人类社会进步的一项重要标志,高等教育大众化成为现代社会发展和人类自身发展的必然选择。在当今世界范围内,发达国家和许多发展中国家已经实现或完成了
后勤作为学校教学、科研的保障部门,能否充分发挥其职能直接影响到学校教学、科研工作的正常开展。高校后勤实体是我国高等教育的重要组成部分,也是新时期我国新型高校后勤保
随着经济全球化的发展,服务外包已经成为国际服务贸易和全球跨国直接投资的新趋势。福建省积极把握这一战略机遇,全面启动了以软件外包为重点的服务外包,但是在承接服务外包
本文是以慧远为研究对象,主要研究的是慧远的佛学思想,次要研究了他的念佛特色和念佛依据经典,还有他在佛教中国化的道路上所作出的贡献。文章的第一部分主要简单叙述了慧远
论《临时约法》对民国政体的设计规划杨天宏1912年3月31日由南京临时政府颁布实施的《中华民国临时约法》是中国近代历史上绝无仅有的一部具有共和民主性质、可以“伦比宪法”的文件
《伤寒论》是张仲景“勤求古训、博采众方”的集大成之作,对中医的最大贡献之一就是创立了六经辨证。是中医临床辨证学、治疗学发展史上的里程碑。《伤寒论》贵在朴实可学,经
这里是亚洲最人、我军最现代化的大型合成战术训练基地4年来,一支支雄师劲旅从这里走向"战场"这里上千项科技练兵成果得到检验论证,数百个新战法训法诞生
围绝经期高血压是临床常见的疾病,由于其血压波动明显,还伴有植物神经功能紊乱症候群,单纯使用西药降压药的疗效并不令人满意,而中医药治疗突显了其优势。本文分别从中医对围