数据分析技术在图像分类中的应用

来源 :东北财经大学 | 被引量 : 1次 | 上传用户:gidzkid
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国大规模的基建投资和工业化进程的加速推进,铝型材全行业的产量和消量迅猛增长,而我国也一跃成为世界上最大的铝型材生产基地和消费市场。经过长达近10年的高速增长,我国铝型材行业步入了新的发展阶段,并展现出了诸多新的发展趋势。目前我国铝加工工业处于大而不强、小而不精的状态,迫使国民经济和现代科学所需的一些高精尖铝型材仍然需要依靠国外进口。推动铝型材产业的发展一方面我们需要在工业领域深耕,另一方面我们需要在铝型材生产质量上严格把控。工业上铝型材的质量监测工序繁杂且需要大量相关专业理论知识,本文将着重讨论如何通过数据分析方法来解决铝型材的质量检测问题,本文中的质量检测是指对铝型材表面常见的12种瑕疵进行分类。传统的铝型材表面瑕疵检测通常由有经验的工艺工程师抽样检测来完成,这个过程由统计学中的抽样理论与工艺工程师的经验技术为基础,一直备受工业界推崇。相比传统质量检测的方法,使用算法检测质量可以用更低的成本获取更高的精度。就本文的任务而言,算法做质量检测有两大挑战,其一在于瑕疵类别数量间的严重不平衡问题,样本不平衡现象会导致模型无法训练充分。其二是模型的过拟合问题,对某些具有轻微划痕的正常类别的铝型材而言,如果算法过于敏感,则会将这类正常样本误判成某类瑕疵样本,或者反之将某类瑕疵样本误判为具有轻微瑕疵的正常样本。传统上,学者们使用统计学方法、信号处理方法、基于模型的方法来提取图像的纹理特征,然后将特征向量输入到分类模型或神经网络中去训练。随着计算机技术的快速发展,深度学习技术得到了广泛的应用,学者们更多使用深度学习框架来研究图像分类的任务。深度学习往往在分类准确率,F1值,混淆矩阵,AUC等评价指标上比传统方法表现更好。首先,针对铝型材数据不同类别之间的严重不平衡性,本文在建模之前采用了基于内容的数据增强和基于数量的数据增强两种方式来做了数据预处理。然后,本文综合考虑了传统方法和深度学习方法,设计了 8种不同的建模思路去对比研究铝型材瑕疵分类问题。在特征向量结合分类器的传统图像分类的建模思路上,本文选取了 3种常用的纹理特征提取方法(HOG、LBP和SURF)和1种本文提出的纹理特征提取方法来提取铝型材图像的瑕疵特征,然后将特征向量传入分类模型中去构建分类器。而分类器的选择上,本文选择了两种统计学分类方法LDA和QDA,两种机器学习分类器SVM和XGBoost。另一方面,本文使用了浅层神经网络LeNet和ResNet50两种建模方法来搭建深度学习分类模型。最后,本文使用了多分类准确率、多分类精确率、多分类召回率、多分类F1值和多分类AUC值作为评价指标,并主要根据多分类准确率和多分类F1值来评价模型的分类性能。在本文建立的全部3 1个模型中,无论采用多分类F1值还是多分类准确率作为评价指标,排名前5的模型均表现一致,按顺序分别为:XGBoost_Melt,XGBoost_Surf,QDA_Melt,LDA_Melt,SVM_Melt。以往很少有学者使用XGBoost算法来解决图像分类问题,而本文排名前2位的算法都基于XGBoost方法,这表明如果特征对图像的表征能力较强,XGBoost算法在图像分类问题上也可以获得优秀的分类性能。除此之外,排名前5的算法中有4种方法都是基于本文提出的Melt纹理特征提取方法,其中排名第一的算法XGBoost_Melt在测试集上获得了 90%以上的多分类准确率。综合全文,本文创新性的将XGBoost算法分别与HOG、LBP、SURF特征结合并取得了不错的分类效果,同时本文提出的基于HOG、LBP和SURF的融合特征Melt在不同分类器上均获得了很好的分类效果,这也为其他分类任务提供了一种借鉴思路。另外,本文将统计学、机器学习和深度学习方法应用到改善传统铝型材质量检测场景中,并取得了 90%以上的多分类准确率,体现了实践创新。工业场景千差万别,但只要根据工业对象做具体问题具体分析就可以将本文所使用的算法迁移拓展到其他工业分类场景中。
其他文献
2013年12月28日《公司法》修正案正式通过,公司的资本制度发生了巨大的变化,公司的注册资本由实缴制变成了认缴制。《公司法》取消了限期缴足出资的强制性规定,股东可以自由约定出资期限,此举虽减轻了股东的资金压力,激发了经济活力,但也导致了股东利益和债权人利益保护的冲突。当公司不能清偿到期债务,而股东的出资期限尚未届满时,能否要求股东提前履行出资义务以保全债权人的利益?对此,理论界和实务界均争议颇大
注意义务是过错判定的客观化标准,作为判例法的产物,在英美法系和大陆法系的侵权法上都展现了卓著的生命力。当前,网络存储服务商扮演的角色已愈发偏离中立,避风港规则已出现式微趋势,与此同时,我国法官在版权侵权纠纷中频繁地援引注意义务要求网络存储服务商承担更多监控责任。注意义务的扩张,反映了一个事实:在关系网更加密切的现代社会,民法正经历从关注行为自由到关注社会安全的价值嬗变,与之相适应的是,作为网络环境
随着风险社会的到来,行政机关越来越需要重视其行政决策所带来的一系列不确定性的负面后果。为此,我国从中央到地方制定了一系列关于重大行政决策风险评估的制度。对这一系列
目的本研究旨在讨论错配修复蛋白MLH1、MSH2、MSH6、PMS2缺失及MMR功能状态在结直肠癌组织中的表达与临床意义。同时对随访资料完整的结直肠癌患者进行风险因素分析,探讨MMR功能状态与结直肠癌患者3年预后之间的相关性。材料和方法1.回顾性收集2010年1月2016年12月在空军军医大学第一附属医院消化外科进行手术治疗的结直癌患者临床病理资料,共1560例。根据错配修复蛋白缺失判断MMR功能
在《专利法》第四次全面修改之际,《中华人民共和国专利法修订草案(送审稿)》引入了专利当然许可制度,根据最新的《中华人民共和国专利法修正案(草案)》,其仍然在列。我国专
作为政治态度的重要组成部分与个体政治行为的重要预测指标,政治效能感历来是西方学界研究的一个焦点内容。随着我国国家治理体系和治理能力现代化改革的探索与发展,我国学界
基于深度图的算法在2D-3D图像转换领域中占据主导地位,但是由于深度采集设备造价高昂,且在某些场景中获取深度线索的难度较大,使得如今的全自动3D内容生成算法还无法投入到大规模的应用当中。在目前的2D-3D图像转换方法中,大部分模型都仅针对某一状态的图像进行转换,并没有同时兼顾静态、动态两种生成需求。为解决上述问题,从以下两方面对2D-3D图像转换方法进行研究:(1)为解决深度采集设备成本高昂和深度
《蒙古源流》是萨冈彻辰的代表作,是十七世纪末蒙古史学史上一部伟大的史书之一。他从亲身经历和亲眼目睹的事实中找出了当时的蒙古衰弱的原因,并以“生死归宿世更换,昼夜交替是规律的”的真理来教育自己的后代。希望他们能够尊重真理,重视智慧,以知识为武器。要始终保持《明智的大臣即使受到排挤,始终会显露出自己的智慧/燃烧的油灯即使被打翻,火苗也会向上燃烧》的理念,即使是在艰苦的环境中也能够坚持下去。本文在前人的
科技与经济的发展推动了世界各国中等教育进步,中等教育再次聚焦精英与大众教育问题。英国文法学校几经波折的改革,终其根本是平衡精英教育与大众教育的发展,使教育朝向民主化与优质化方向发展。研究的主要对象为英国文法学校,以分析文法学校改革背景、进程、结果为主要内容。将英国文法学校与我国优质中学做比较研究,分析其差异,总结经验,在理论方面为我国优质中学提供思想指导,在实践中提供经验与技术引导。比较教育研究法
网络内容聚合服务,是指通过搜索引擎、数据挖掘、网络链接、转码等技术,将分散在网络空间的文件资源整合起来,使得网络用户能够通过一站式平台访问该文件资源的网络服务。聚合网站在获得商业成功的同时,也因其截取了被聚合网站的用户流量而遭到被聚合网站的抵制。自网络内容聚合服务产生以来,就伴随着一系列的法律纠纷。其中给最为典型的是对网络聚合服务中所使用的深层链接和转码技术是否侵犯信息网络传播权和复制权的纠纷。对