基于词袋模型和迁移学习的图像分类算法研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:liongliong587
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网及多媒体时代的迅猛发展,海量的图像信息充斥在人们生活的方方面面。近年来,如何从海量图像中快速、准确地获得其分类信息成为一种迫切需求。图像分类技术作为计算机视觉领域的热点问题,其研究意义极其重要。在实际应用领域中,视频监控系统的车型行人分类的应用非常广泛。由于实际应用对分类准确率和实时性要求较高,所以如何设计能实际应用的算法成为一个重要问题。其次,在已有大量标记图像样本域(源域)和新的少量样本域(目标域)的条件下,如何充分利用现有知识提高目标域上的分类准确率有很强的应用意义。因此本文针对这两个问题展开。针对第一个问题,本文采用基于词袋模型的车型行人分类方法。首先,考虑到光线和几何不变性,本文提取HOG特征作为图像特征描述。其次,为了避免高维特征造成的信息冗余和噪声,本文采用了主成分分析法对高维特征进行降维处理。最后在训练阶段,通过采集道路视频建立一个由30016张图像构成的由6种类别构成的有标记数据库,并训练出非线性的SVM分类模型,其中核函数采用的是RBF核函数,并通过K-fold交叉验证法优化模型参数。本文提出的基于词袋模型的车型行人分类算法在分类准确率及实时性上都能满足实际应用的要求。针对第二个问题,由于实际获取标记样本困难,而少量的标记样本无法训练出理想的分类器,本文提出一种基于迁移学习的图像分类算法。不同域的数据特征分布有差异,直接使用源域数据对目标域样本进行分类的效果并不理想。因此为了提高源域的类内紧凑性和类间区分性,本文首先提出一种改进的边际Fisher准则方法,采用内积度量的方式对源域进行了特征映射。其次,本文提出了一种去除源域中的边缘奇异点并与目标域中的标记样本点组成训练样本对的自适应算法,来保证在迁移学习阶段筛选出合理的训练样本对。并在核化空间上,本文学习了目标域到源域的特征转换,将目标域映射到源域。最后利用源域上训练好的knn分类器完成对映射后的目标域样本的分类。本文算法创新点主要有:(1)改进传统的边际Fisher准则,更充分地利用源域标记样本;(2)重点考虑迁移学习与训练样本对紧密相关,提出一种自适应训练样本对筛选算法,尽可能保证映射的可靠性。在通用数据集上的实验结果表明,本文的算法不仅提高了在小样本数据上的分类性能,而且随着目标域可用标记样本数的增加,本文算法的性能较其他算法提升得更明显。
其他文献
英语是学生必须要掌握的一项基本技能,随着经济水平的不断提升,我国与其他国家之间的交流也越来越频繁,英语作为一门世界性通用语言,在教育中占据十分重要的地位.加强英语教
随着移动通信技术的不断发展和新业务需求的不断增多,移动通信系统的抗干扰性能、抗衰落性能、以及抗截获能力等诸方面要求的提升,传统的固定载波频率的无线通信方式已经不能
多镜面折反射成像系统是一种由单个相机和多个镜面组成的新型成像系统。由于其在单次成像中可以获得多个大视场图像,继而重构三维场景,多镜面折反射成像系统在机器人导航、场景监控、环境感知和三维重建等众多领域中有着广泛的应用。建模并标定折反射成像系统是诸多应用中的必要步骤。多镜面折反射成像系统是一种复杂的非单视点成像系统。现有的多镜面折反射成像系统的标定方法,往往模型复杂操作繁琐且精度有限。因此,研究多镜面
目前,医学方面的药学专业也在随着社会的发展逐渐进步,我们应确保其质量达到标准,从而确保人们的安全.在医学上,制药等的药学研究是非常重要的,医药的质量关系到我们每一个人
学位
随着网络应用的日益深入,网络安全正成为阻碍网络发展的重要问题。当前越来越多的网络攻击是基于主机的异常连接行为,而传统的安全技术都是被动防御。   主机角色控制模块是
党校是一所红色的学校,在这里,不知有多少热血青年从四面八方走了进来,接受党的洗礼;在这里,不知有多少怀揣梦想的仁人志士走了出去,成为建设社会主义事业的中流砥柱.说起党
随着无线通信与信息网络等技术的迅速发展,无线Mesh网络作为一种无线宽带接入技术的多点对多点网络已成为近年来学术界和工业界的研究热点之一。无线Mesh网络被称为廉价的最
分布式移动多载舰OTHR(over-the-horizon radar,超视距雷达)系统是将雷达装载在多个移动平台上的功能强大的移动探测系统。此系统不仅能够克服单载舰地波OTHR系统所具有的方
随着社会的不断发展,各行各业需求人才的数量也随之增加,对于机械、建筑、电子等工科领域方面,绘图是最基础的专业知识,学好了绘图将更容易在该行业立足.作为计算机辅助绘图