图像自动标注方法研究

来源 :复旦大学 | 被引量 : 0次 | 上传用户:TT_sky
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高分辨率数码相机的普及和网络传输带宽的增加促进了数字化图像的大量产生和堆积。如何有效地管理与检索如此大规模的图像数据库已成为当前信息检索领域的重要课题。传统的基于内容的图像检索技术由于“语义鸿沟”不能很好地满足图像语义检索的要求。图像语义检索通过对图像建立文本索引可以提供用户友好的文本检索接口,其关键问题在于如何自动对图像进行语义标注。因此,图像自动标注是图像检索中重要而极具挑战性的工作。图像自动标注可以利用已标注的图像集自动学习底层视觉特征(比如颜色、纹理)与高层语义(比如自然风景、建筑物)之间的关系模型,并通过此模型标注未知语义的图像。将每个语义关键词看作一个类标签,我们可以通过使用多类分类技术实现对未知语义的图像进行标注。SVM以其良好的泛化能力被广泛应用与分类问题中,但是传统的SVM是基于两类分类的。目前解决多类分类问题的方法大多将其分解为多个两类分类问题,随着训练数据和类别的增多,这样处理时间开销将急剧增加。针对该问题,本文提出了两种改进算法:首先,提出一种新的解决多类分类问题的方法,称之为简单的多类支持向量机(Simplified Multi-class Support Vector Machine, SimMSVM),SimMSVM求解一个二次优化问题“一次性”实现多类分类,且通过引入一个简化的损失函数降低求解问题的规模。我们扩展SimMSVM将其用于图像自动标注,并有效提高了训练分类器和标注图像的速度。其次,我们将支持向量数据描述(Support Vector Data Description, SVDD)方法用于图像自动标注。SVDD通过建立包围目标类的超球来拒绝非目标类数据。该算法对每一类的样本数据单独构造超球,显著地降低了求解问题的规模和复杂度。SVDD可以很容易地处理多类分类问题,通过训练好的超球边界对未标注图像进行分类并实现语义标注。
其他文献
我国的高等教育已经进入了大众化发展阶段,随着校园规模不断扩大,在校生剧增,学生的需求也呈现出多样化、复杂化和个性化的特征。而绝大多数高等院校的学生管理软件一直是以
信息时代的到来,极大的方便了人们获取相关的多媒体信息,大量的数字产品丰富了人类的生活,但是也给版权保护问题带来了新的挑战,数字水印技术以其在版权保护方面的独特优势成
移动Ad Hoc网络是一种自组织、无中心、无需基站支持的多跳无线网络。该网络可以在节点拓扑变化很大的情况下工作,并且被越来越广泛地应用于各个领域之中。Ad Hoc网络中的各
随着图像处理和双目视觉技术的研究和发展,这两种具有低成本、非接触、高精度特点的技术,已经应用到了越来越多领域。处于经济发展方式转型期的皮革制造行业,面临着一系列机遇与
物资管理是高校饮食中心管理工作中的重点和难点,尤其是在高校规模不断扩大的今天,如何有效的突破物资管理的瓶颈,优化物资营运流程,对于实现物资的统一协调管理具有重要意义。工
局部路径规划是机器人技术中的关键技术之一,与全局路径规划相比,其更能体现出机器人的智能性。本文针对自治水下机器人(AUV)的运动特性和所处环境的复杂性,提出了一种设计AU
近年来,基于TCP/IP技术的互联网快速发展,网络为人们的生产和生活提供了极大便利,互联网已经成为了人们日常生活、工作、企业运营和管理中不可或缺的一部分。但是随着网络的
随着世界环境问题的日益严峻,绿色计算成为信息技术领域的重要组成部分。另一方面,全球消费者对尺寸更小、功能特色更丰富,同时电池寿命更长的便携式装置的迫切需求,让功耗问
实时的人数统计是当前计算机视觉领域的热点研究问题,且具有重要的实际应用价值。目前的行人检测算法,大部分基于单目摄像头所拍摄的彩色图像,或是跟踪人的运动轨迹或是建立
问答系统能够以自然语言的方式进行提问,并能以自然语言的形式进行回答,是一种新型的智能搜索引擎。与传统的搜索引擎相比,问答系统能更好的满足用户的查询要求,更准确地检索