基于“最小原型簇”的图像场景分类技术的研究

来源 :江苏大学 | 被引量 : 0次 | 上传用户:xiaoguang0623
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像场景分类是图像识别、图片搜索等领域的关键技术,广泛应用在地图导航、自动驾驶等现实问题中,是计算机视觉领域的一个重要研究方向。在当前大数据时代背景下,图像场景分类任务日益复杂,且面临数据分布多变和标注样本不足等挑战。半监督聚类能够在少量有标签数据的指导下有效发现数据的自然分布结构,因此结合半监督聚类来提升复杂场景分类的性能已经成为近年来的研究热点。在查阅大量国内外文献的基础上,本文首先介绍图像场景分类的研究背景、意义及现状,然后针对图像场景的复杂性、多变性以及训练数据不足等问题,提出基于最小原型簇的半监督聚类算法,并进一步将该半监督聚类算法与图像场景分类方法相结合以改善分类性能。本文的主要研究内容如下:(1)基于最小原型簇的图像场景半监督聚类方法。由于图像场景的复杂性以及分类和聚类存在差异性,半监督聚类在利用有类别标签的样本时可能难以得到理想的簇划分。本文提出一种基于最小原型簇的场景图像半监督聚类方法,利用有标签样本来衡量簇的紧密性并指导簇的分裂,直到每个簇都足够紧密且簇中所有样本都属于同一类别,即得到最小原型簇。相应地,提出一个新的半监督聚类目标函数,将簇的紧凑程度引入原聚类损失函数。该方法极大地改善了原半监督聚类的性能。而且,该方法适用于绝大部分聚类算法,尤其适用于基于数据划分的聚类算法,因此进一步提出基于最小原型簇的半监督K-means方法。(2)结合半监督聚类的图像场景分类方法。针对图像场景分类中图像场景多变、训练样本匮乏、数据样本不平衡以及单一分类器泛化能力差的问题,本文提出一种结合半监督聚类的图像场景分类方法。该方法利用基于最小原型簇的半监督K-means方法筛选出近似服从真实分布的伪标签数据,用来补充训练数据集,以改善训练样本匮乏的问题,同时控制图像场景多变性带来的风险;然后,使用过采样方法再次补充训练集,用于改善不平衡数据集中少数类准确率较低的问题;接着,在新的训练数据集上训练分类器;最后,将半监督聚类方法和分类方法的预测结果相结合,改善了单一分类器泛化能力差的问题,进一步提高了图像场景分类的准确率。(3)设计实现图像场景分类原型系统。本原型系统在Visual Studio 2015上设计与实现。系统被分为图像预处理、模型训练、图像场景分类三个模块。本原型系统有着简洁的界面设计、方便快捷的操作流程,验证了本文方法的可行性和设计的原型系统的可用性。
其他文献
行人再识别在智能视频监控、智能安保等领域发挥着巨大的作用,在计算机视觉领域已经成为了一个研究热点,近年来受到了大量学者的关注。优秀的行人再识别模型可以抽取出高鲁棒性的行人特征,使得行人分类更加准确,进而有益于完成监控与安保等任务。受限于行人再识别数据集中样本数量与样本类别的不足,许多在现有行人再识别数据集上训练出的模型容易过拟合。生成对抗网络可以通过拟合原始数据集分布从而生成全新的样本,因此,使用
摩擦磨损试验机作为材料摩擦研究的重要组成部分,它的工况形式、测量结构等因素对试验结果起着关键作用。目前国内高校与企业研制的环-块摩擦磨损试验机的运动与接触模式大多是恒定不变的,工作参数在试验中缺少变化。而诸如柱塞、轴承和轮辋之类运动器件工作时的摩擦形式一般都比较复杂,其所受载荷、接触方式、温度等参数往往会经历动态的变化过程,若使用这类传统试验机进行测试的话,其结果对于最终的工程应用可参考价值有限,
推荐系统的出现缓解了信息过载所带来的一系列不便问题,为用户提供精准的信息推荐。但是数据稀疏性、冷启动等问题仍然对推荐系统的性能产生了极大的限制。随着新热点深度学习技术的崛起,文本处理技术也迎来了新突破。研究人员开始利用文本处理技术将评论文本向量化表示并利用评论文本的信息实现推荐,这在一定程度上缓解了数据稀疏性问题。以此为契机,基于评论文本的深度推荐模型受到了极大的关注,而如何从评论文本中挖掘出更多
随着计算机技术的迅速发展,模式的表示与识别已经成为人工智能领域研究的重点和热点。在模式分类中,协作表示(Collaborative Representation,CR)作为一种典型的线性表示方法取得了良好的性能,且广泛应用于人脸识别和图像分类中。由于协作表示简单高效,因此受到广大学者的青睐。协作表示算法使用所有的训练样本协同地表示测试的样本,获得了良好的分类结果以及性能。然而,该方法目前仍存在诸多
带压作业可以有效保护地层压力和生产潜能,减少对作业环境的污染,提高作业效率。本课题在传统带压修井作业装备结构基础上,结合模块化的理念设计了一套高集成度的新型管杆一体化带压作业机,同时为提升带压作业机液压举升系统的同步跟踪精度,重点开展了单路位置跟踪控制算法及双路同步控制策略研究。论文主要的研究内容如下:(1)针对传统带压作业装备普遍存在结构通用性差、占井周期长及施工成本高的问题,在现有油管带压作业
近年来,深度学习技术被广泛应用于计算机视觉的各个领域,并取得了显著成功。在医学肝脏病变CT图像分类任务中,基于深度学习的技术发挥着至关重要的作用。然而,由于有价值、高质量肝脏标记数据的不足以及部分肝脏病变图像存在的类内差异性与类间相似性,致使目前肝脏病变的分类精度尚不理想。为此,本文将深度学习技术应用于医学肝脏CT图像领域,对肝脏数据增强与肝脏病变分类展开了研究,主要研究内容如下:(1)针对肝脏标
现代数控技术是一个国家制造工业现代化的基础,其技术水平的高低对国家工业能力以及经济发展具有至关重要的影响。相比于传统数控系统的直线、圆弧插补,非均匀有理B样条(Non Uniform Rational B-Spline,NURBS)插补技术在现代制造领域中大大提高了零件加工效率和质量。然而,数控伺服控制系统中运动轴的响应滞后、动态参数不匹配以及非线性干扰等,不可避免会导致零件加工时轮廓误差的产生。
永磁同步电机因其结构简单、噪声小、性价比高、转动惯量小等优点,在工业、发电、军事、交通等领域被广泛应用,而滑模变结构控制因其优秀的控制性能,在永磁同步电机控制领域大放异彩。但永磁同步电机是一个复杂的非线性系统,因此,研究新型滑模控制技术至关重要。分数阶滑模控制技术在继承滑模控制技术优点的同时,进一步提高了控制系统的性能,为永磁同步电机滑模控制系统提供了一个新的研究方向。本文结合分数阶滑模算法和广义
双三相永磁同步电机有着功率密度大、转矩脉动小、可靠性高的优点,在伺服控制系统中逐渐被用作关键执行部件,高性能控制策略的研究也成为热点。本文对双三相电机的电磁特性、结构特点和数学模型进行了分析,在此基础上对典型伺服控制系统的频率特性进行了研究。针对典型位置伺服系统电流响应差、反应速度慢、跟踪精度低等问题,提出了相应的改进方法。在电流环添加反电动势补偿,以改善电流响应;在速度控制器的积分环节添加限幅,
航空发动机是飞机的心脏,发动机性能很大程度上取决于涡轮进口温度的高低。在材料耐温能力有限的情况下,以薄壁双层壁叶片为代表的新型叶片冷却结构的提出对发动机性能的提升具有重要意义。为促进薄壁双层壁叶片结构在发动机中的实际应用,本文基于数值模拟研究了不同长径比下基本气膜孔型(圆柱孔、扇形孔及前倾孔)的气膜冷却特性变化,在此基础上对扩张孔结构进行优化;另一方面,基于心形抗涡孔的构建理念设计了圆锥组合孔,分