集成代价敏感和深度学习技术的图像分类

来源 :西南交通大学 | 被引量 : 0次 | 上传用户:a12c3d4e5f6
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和互联网技术的高速发展,人们每天通过网络接收的信息呈几何倍数增长,其中图像信息也随着多媒体技术的不断改进所占比例越来越大。同时,各大企业、政府机构在通过图像分类技术为工作生活增加便利。图像分类的一般步骤分为数据输入、特征提取和分类。其中,图像的特征提取是完成分类任务的重要基础,直接影响分类的性能。另外,某些领域的图像数据分布不平衡也会带来很多问题,不仅会影响分类效果,还可能因为忽略了少数类的重要性,造成一些无法挽回的损失。针对不平衡图像分类中少数类分类准确率低、误分类代价高,以及人工提取特征主观性强而且费时费力的问题,本文提出了一种基于卷积神经网络和代价敏感的不平衡图像分类方法(Triplet-CSSVM)。该方法将分类过程分为特征学习和代价敏感分类两部分。针对特征学习,深度学习中的卷积神经网络(CNN)是一种有效的手段。但存在经典CNN面向的是平衡数据集,使用的损失函数softmax对图像的细节学习不够等问题。因此,本文利用损失函数为triplet loss的卷积神经网络结合重采样方法对图像特征进行学习。不仅能学习到图像更细节的特征,还对数据集进行了一定程度上的平衡化。在训练CNN时,引入迁移学习的思想,在ImageNet上进行预训练后,再在实验数据集上进行微调,解决了实验数据量小可能造成的网络不收敛或过拟合的问题。针对代价敏感分类,传统分类方法大多没有考虑代价信息,很难在不平衡数据集上获得好的分类效果。本文通过给不同类别赋以不同的代价因子,使传统支持向量机算法代价敏感化。代价敏感的支持向量机(CSSVM)的优化目标为使总代价最小。本文在深度学习框架Caffe上使用人像数据集FaceScrub和垃圾邮件数据集personal spam通过改变数据集的分布,进行多组实验。实验结果证明,与传统分类方法相比,本文方法在多种复杂的不平衡数据上都能获得更好的分类效果。
其他文献
推动构建人类命运共同体是中国针对“建设一个什么样的世界、如何建设这个世界”这一重大课题而提出的“中国方案”。人类命运共同体的本质是利益共同体,它是现代生产力与市
介绍了一种用于蒸汽管回转干燥机的新型组合密封,此密封结构对于大直径,低转速的回转密封面,不仅径向方向具备良好的密封性,同时对筒体的轴向跳动具有补偿性,实现轴向端面的
纳米材料的合成、结构功能特性及其应用的研究成为人们共同关注的前沿课题.CeO_2是一种廉价而用途极广的材料,如用于发光材料、催化剂、电子陶瓷等.细胞色素c是一种含血红素
无害化、减量化、资源化处理是解决固体废弃物污染问题的主要内容。目前,固废的处理主要有安全填埋、生物堆肥和热处理等方式。安全填埋的方式占据了有限的土地资源,而生物堆肥需要满足微生物对生存环境的需求。对化工生产的固体废弃物的热处理是达到废弃物减量化、无害化、资源化处理的有效途径,也成为当今国内外固体废弃物处理研究的热点。增塑剂邻苯二甲酸二辛酯(DOP)生产过程产生的固废成分主要是活性炭、DOP等有机物
本文从幼儿歌曲创作课程目标与设置、课程内容、教学方式、教学考核和教学改革特色五个方面详细阐述了本专业课程的相关改革和成效。希望能够总结出一定的经验,推动幼儿歌曲
风景画是绘画艺术发展历程中的一种重要表现题材,它在整个世界美术领域中地位崇高,先后经历了萌芽期、独立期、发展期以及成熟期等多个阶段,并在十九世纪现实主义的主导下,将其极为丰富的人文精神特质充分呈现出来。十九世纪风景画在人文内涵、创作观念以及形式手法等方面的创新都直接影响到后世风景画创作,其中以巴比松画派为代表的法国现实主义风景画在整个世界风景画领域中最具代表性,可以说是十九世纪风景画中的瑰宝。巴比
据联合国有关机构评价,世界上唯一一个国家森林面积、森林覆盖率达到20%增加的就是中国。虽然去年10月下旬以来发生的持续大范围严重旱情,涉及到15个省区市,林业受害面积达1.18亿
针对武汉市孵化器政策有效性问题,从基本政策工具和孵化器建设全过程两个角度构建二维分析模型,并对2006—2015年之间的政策文本进行量化处理,分析武汉市孵化器政策运用的过
目的:急性缺血性卒中(acute ischemic stroke,AIS)发生后,无法获得快速且有效的脑血流重建是脑梗死灶进展的主要原因。近年来,由于脑梗死急性期血管内治疗材料的更新、技术的
人类在感知、理解物质世界和精神世界的过程中,通过隐喻将身体经验感知与抽象事物联系起来,从而形成认知。语言是在感知世界的基础上,通过认知加工才形成的。隐喻存在于语言