基于部件检测和视觉特征的服装图像分类方法研究

来源 :昆明理工大学 | 被引量 : 0次 | 上传用户:b56240320
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
伴随着现代信息技术在我们生活中的逐步深入以及“互联网+”新业态的发展,互联网与各行各业深度融合,电子商务也快速活跃起来,人们的生活和购物方式已得到深刻的变革,电商服装购物已成为一大支柱性产业,体现出普及化、全球化、移动化的趋向。由于服装产业在网络购物中具有巨大应用前景以及潜在利益,网络涌现出大量服装图像,使得服装分类方法广泛应用于电子商务中的“以图搜图”以及服装搭配、推荐等领域,极大地推动了该方面的研究。为此,本文为了解决服装图像大多基于简单款式的粗粒度分类,且分类准确率较低的问题,以时尚女装为例,提出基于部件检测和视觉特征的服装图像分类方法研究,实现提高服装分类准确率和精度的目标,以更好地满足实际应用中的需求。首先,针对目前时尚女装图像检测由于拍摄场景及人体姿态众多,检测准确率不够准确的问题,提出一种基于可变形模型(DPM)的服装图像部件检测方法。该方法首先对梯度方向直方图进行计算,然后进行归一化、截断及降维,获取DPM特征表示;其次计算位置与根模型、部件模型的响应得分;最后通过响应变换推算部件的最优位置,得到目标综合响应分数输出检测结果,较好地适应了不同人体姿态和视角变换的人体部位检测以及寻找具有区分性的部件区域。然后,针对目前时尚女装图像分类方法对于时尚领域的专业设计特点不够具体,分类准确率不够高的问题,提出基于视觉特征和潜在支持向量机(LSVM)的服装图像粗粒度分类方法。利用DPM得到训练和待分类时尚女装图像的检测结果,提取检测后图像的底层视觉特征,建立时尚女装粗粒度款式和属性表,基于LSVM算法对时尚女装图像进行监督学习,进而实现准确率较高的粗粒度分类。最后,针对时尚女装款式和属性更为细致和复杂,而且不同类型间属性差异细微的问题,提出基于款式特征描述符的服装图像细粒度分类方法。以时尚女装为例,定义了能够描述服装细粒度属性的款式特征描述符,并将款式特征描述符与提取到的4种底层特征进行匹配,提高了特征提取的有效性和准确率;采用随机森林和多类SVM相结合的方法对不同时尚女装款式以及属性分别进行监督学习,实现了时尚女装图像的细粒度分类,具有较高的分类精度和准确率。
其他文献
近年来,人工智能研究因数据量的增加与计算能力的提升在图像识别、自然语言处理、自动驾驶、智能家居、机器人等应用领域发展迅速,研究者们提出了各类优秀的人工智能算法,如支持向量机、决策树、卷积神经网络、循环神经网络、深度森林、深度强化学习等。深度强化学习是一种结合了深度学习与强化学习理念的算法,自其被提出起,就因其强大的学习能力被许多研究者视为实现通用人工智能的关键。强化学习算法最早出现于自动控制研究中
2015年7月到2017年6月,由万科公司与“宝能系”展开的股权争夺事件在资本市场上产生了巨大反响。目前我国上市公司治理模式还不是很完善,很多上市公司股权结构存在问题,导致这些公司同样面临着股权争夺的风险。因此,围绕万科公司股权争夺所产生的一系列事件进行分析,会使人们对于股权争夺对财务绩效影响问题产生更多的关注和思考。股权实则是企业的控制权,企业管理制度不健全、股权结构不集中等因素都可能引起股权争
随着互联网的高速发展,网络上出现越来越多的非法信息,比如色情、暴力、毒品等信息,如何检测出这些非法信息成为当下重点研究问题。非法信息分类属于自然语言处理中的文本分类任务,但是与传统的文本分类相比,网络搜索query文本存在着噪声多、长度短、新词多等特点,所以如何构建出高效的文本表示模型和文本特征提取模型是一个研究的重点。文本分类技术涉及到自然语言处理、数据挖掘等领域的许多技术。影响文本分类准确度的
差分跳频(Differential Frequency Hopping)作为一种将编码、调制和跳频技术结合在一起的技术,主要依靠发送频率的相关性,通过频率转移函数来控制频率的发送,所以差分跳频技术本身就具有良好的纠错能力,并且可以高速地传输数据。本文以差分跳频技术的抗干扰性能为出发点,首先对决定差分跳频序列性能的频率转移函数进行分析,并提出一种基于混合加密算法的频率转移函数的构造方法。然后提出差分
进入21世纪以来,我国的经济发展迅速,城镇化建设进程加快,我国对建设资金的需求量不断增加。从我国财政部门的计算来看,到2020年,我国60%左右的地区内都能有望实现城镇化建设,同时城镇化建设所造成的投资需求也会迅速增长,增长额大约为42万亿。由于市场调节具有一定的局限性,因此国家采用宏观调控政策对房地产市场的运行进行控制。宏观调控政策的实施使原来的以“卖地”为主要财政收入来源的方式被市场所淘汰,除
地震是造成抗滑桩等支挡结构失稳破坏的重要因素之一。由于地震的复杂性和不可预测性,导致在岩土工程中,边坡及其支挡结构地震反应特性的研究成为世界性难题。而预应力锚索抗滑桩作为边坡加固的常用方法之一,开展基底铰支承条件下预应力锚索抗滑桩地震动力响应特性研究可以为边坡治理抗震设计提供理论依据。鉴于此,本文以云南省应用基础研究计划项目“基底铰支承预应力锚索抗滑桩的地震动力响应特性及抗震研究”为契机,首先,通
在非结构化的果园生态环境中,苹果的生长环境非常复杂,果实往往互相重叠或果实被树叶遮挡,导致苹果采摘机器人不能快速以及准确地识别和定位目标苹果,严重影响苹果采摘机器人的采摘效率。为了解决的这一个问题。本文针对苹果重叠和遮挡等问题,提出一种新的方法。主要研究内容和结论如下:本文具体介绍了K-means算法、OUST阈值分割、色差法三种分割算法,并且对三种算法进行了对比分析。经过实验得出,K-means
近年来,公路建设投资突飞猛进,高等级公路不断增长,路网功能以及交通服务水平不断提升。传统高等级公路拼盘制的投入方式,要求地方自筹一部分项目投资。然而,贫困地区基本属
落叶松树皮作为落叶松木材产业的副产品资源丰富且价格低廉,挖掘落叶松树皮的潜在价值,变废为宝有着极其重要的意义。本研究采用闪式提取方法提取落叶松树皮中的原花青素,而后利用溶剂分级萃取进行了精制,并对其进行了稳定性、抗氧化性以及对α-葡萄糖苷酶的抑制性研究,为落叶松树皮的开发提供了一定的理论依据。本论文的研究内容主要包括以下4个部分:1.对落叶松树皮中原花青素的闪式提取工艺进行了优化。在用水做提取溶剂
传统的被动悬架在一定程度上可以降低汽车的振动,但随着人们对舒适性要求越来越高,被动悬架将无法满足大众的需求,而以磁流变液(MRF)为智能材料的磁流变阻尼器(MRD)因其具有响应迅速、低能耗及阻尼力连续可调等优点成为半主动悬架比较理想的部件,国内外有许多学者针对MRD进行大量的仿真与试验研究,但磁流变悬架技术尚未完全成熟,MRD并未得到广泛应用,这需要广大的科研工作者继续深入研究。基于此,本文针对不