基于SIFT特征表示和稀疏编码的多标记场景分类

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:oswaldhui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着现代社会的信息技术发展和现实需要,图像作为信息的一种快速、有效地描述方式和存储载体,获得了大众的广泛关注。如何让计算机按照人脑对信息的解译方式准确地、快速地从大量的图像信息中自动获取所需的信息,成为了计算机视觉领域中一个亟待解决的问题。多标记学习是针对现实世界中普遍存在的多义性对象而提出的一种学习框架,目前广泛应用于目标分类和识别问题中。由于尺度不变特征变换(Scale-Invariant Feature Transform,SIFT)可以克服由图像平移、旋转、亮度和尺度变化带来的误分,且该方法对于光线、噪声、微视角改变、部分物体遮蔽的容忍度也相当高,在文本分类、自然场景分类和视频分类中均取得了较好的结果。因此,本文基于SIFT特征表示,利用空间金字塔模型的稀疏编码和局部线性约束编码方式对特征进行编码,利用多标记k近邻(Multi-Label k-Nearest-Neighbor,ML-kNN)和排序支撑矢量机(Rank Support Vector Machine,Rank-SVM)对目标进行多标记分类。(1)提出了一种基于SIFT特征表示和稀疏编码的自然场景多标记分类方法,本方法通过提取图像的密集SIFT特征,首先用空间金字塔稀疏编码模型对图像进行特征表示和编码,然后用最大化池化方式得到图像的特征分布,最后用两种多标记分类方法分别对自然场景进行分类,得到自然场景图像的分类结果。该方法丰富了图像的空间信息,且特征得到了高效地编码,从而可得到更好的分类结果。(2)提出了一种基于SIFT特征表示和局部线性约束编码的自然场景多标记分类方法,本方法通过从不同尺度提取图像的密集SIFT特征,建立多尺度字典,结合空间金字塔局部线性约束编码模型对图像进行特征表示和编码,然后用最大化池化方式对图像特征分布进行统计并用限制玻尔兹曼机进行特征降维,最后用两种多标记分类方法分别对自然场景进行分类,得到自然场景的多标记分类结果。该方法不仅丰富了图像的空间信息,还丰富了特征的尺度信息,且局部线性约束编码更快速、有效,经过限制玻尔兹曼机降维处理的数据大大节省了多标记分类方法的学习和分类时间,而且得到了更高的分类精度。
其他文献
遥测噪声数据实时无损压缩设备主要目的是实现测量系统模样阶段噪声数据的无损压缩功能并完成相应的验证试验。该设备完成对噪声信号的采集以及无损压缩,最后通过数字通讯接
摘 要: 要培养学生的创新思维,促进学生的智力和能力的发展,增强学生学习的效果,就必须转变教师的教育观念,培养学生的自主学习和创新能力。本文就此进行了探讨。  关键词: 英语教学 创新思维 培养    创新思维是创造有价值的思维。江泽民同志指出:“创新是一个民族的灵魂,是一个国家兴旺发达的不竭动力。”学校应“培养创新精神,提高整个社会的创新能力,增强民族凝聚力”。传统学校教育在教育理念、培养目标、
陶行知先生说过,“发明千千万,起点是一问”。“人力胜天工,只在每事问”。爱因斯坦也曾经说过,“提出一个问题比解决一个问题更重要”。因为解决问题是学习或实验上的技能,而提出新的问题,从新的角度去看旧的问题则需要创造性的想象力。就学生的创新精神培养而言,我认为,问题意识是创新精神的基石,强化学生的问题意识是培养学生创新精神的起点,培养学生的问题意识是造就创新人才的关键之一。那么,如何培养学生的问题意识
在中华人民共和国教育部制定的全日制义务教育、普通高级中学《英语课程标准》(实验稿)中,六个基本理念第一条就是:“面向全体学生,注重素质教育。”课程特别强调要关注每个学生的情感,激发他们的学习兴趣,帮助他们建立学习的成就感和自信心,使他们在学习过程中发展综合语言运用能力,提高人文素养,增强实践能力,培养创新精神。本文着重对学生创新思维的培养作一些探讨。  一、培养创新思维能力是教的最终目的和学的重要