基于深度学习的服装检索研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:bmw
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网以及互联网电商的发展,以图搜图,尤其是服装检索技术,正在被越来越多的商业机构、研究者关注。本文立足于研究服装检索的各个技术模块,以深度学习理论为基础,研究基于深度学习的服装检索技术。本文着重研究服装检索的以下三个问题:1.图像预处理。由于服装图像多种多样,为了排除背景、姿势等影响,需要为系统构建一个服装区域检测的前置模块;2.监督分类及特征提取。不同于传统的手工设计的特征提取方式,基于深度学习,首先需要训练一个深度神经网络模型,再以网络中的某一层输出作为检索特征。3.检索加速设计。随着检索库中图像的增加以及特征维度的增加,检索的时间代价将大幅增加,检索模块需要在保证检索精度的同时降低检索时间开销。本文研究的主要成果和创新点有:1.针对服装区域检测这个特定的问题,改进普适的Faster R-CNN框架,并提出基于先验的随机滑动窗口算法以替代RPN(Region Proposal Network)产生提议区域,简化了训练过程的同时也提升了检测精度。2.针对服装多属性特征,提出语义分层的树形网络结构,提高了高层语义属性的分类准确率,同时使得深度网络能够融合低层视觉特征、中层语义特征和高层语义特征,用于检索的特征更具表征力。3.利用粗粒度过滤加细粒度检索的检索方式及主成分分析(PCA)算法降维以加速检索。我们从京东、淘宝等电商网站上爬取了大量服装图像,除图像外,我们还爬取了商家提供的对服装属性的文字描述,并将其结构化存入数据库中。以此为数据集,我们对服装区域检测、服装分类、服装检索、检索加速进行了实验,实验结果显示我们设计的服装区域检测模块高效而准确,我们的语义分层网络能在一定程度上提升了高层语义分类准确性,并且学习到了服装图像的有效表征,检索加速的同时也保证了检索性能。
其他文献
动静压轴承作为高效精密数控磨床中的核心功能部件,其性能的优劣直接影响到机床加工质量的高低。结合课题的具体要求,本文对用于高效精密磨床砂轮主轴上的液体动静压轴承进行了全面深入的研究:(1)基于流体润滑理论建立了求解动静压轴承稳态温度场分布的数学模型,并通过采用三维流体仿真分析软件FLUENT分析了主轴形状误差对轴承性能的影响。(2)使用FLUENT和ANSYSWorkbench两个软件对液体动静压轴
在污染环境中,粘附在土壤微孔(<2.5 nm)中的大分子不溶性重金属和有机污染物很难去除。腐殖质(humic substances,HS)和微生物均不能进入微孔与污染物接触以与它们反应。为了解决土壤微孔中污染物难去除的问题,我们需要引入腐殖酸(humic acids,HA)小分子量组分(low molecular weights fractions,LMWF)的小分子研究。由于腐殖酸可通过进
机动车交通事故责任属于实践中最常见的一类侵权责任,而机动车使用可能性丧失亦是这类侵权责任中最常见的情形。本文研究目的有二:明确车辆使用可能性丧失是否得以请求侵权的损害赔偿;若可以赔偿,赔偿范围如何确定。使用可能性的丧失请求损害赔偿必须满足侵权的构成要件。而有争议的是使用可能性是否属于受侵权法保护的权益以及使用可能性丧失是否存在可赔偿的损害。首先,使用人可分为所有权人和占有人,各自的利益必然不同。使
在计算机视觉领域,图像匹配是一项基本功能,在图像拼接、目标识别、视觉定位等应用中起着重要的作用。在多种主要的图像匹配方法中,基于尺度不变特征提取算法(Scale Invariant Feature Transform,SIFT)的图像匹配方法有着鲁棒性高的优势。但是,SIFT算法也有明显的缺点:算法复杂度高、计算量大,通用平台的计算能力难以满足实时处理的需求。本文介绍了基于SIFT特征提取算法的硬
阅读是英语听、说、读、写四项基本语言技能之一,学生的阅读水平体现了他们运用语言的综合能力。另外,阅读成绩在英语总成绩中占比较大,这也使得阅读教学在英语教学中显得尤为重要。随着全球网络信息技术的发展,人类从读写时代进入了超文本时代,这要求人们必须能够在不同形式的语言和不同的表达方式之间自由切换。在这一背景下,2017年颁布的英语新课程标准在语言技能中增加了“看”(viewing)这一技能,“看”(v
近年来,随着互联网的快速发展,大量的网上应用所产生的海量数据使用户越来越难以从中快速获取到最有价值的信息。推荐系统的出现给这一问题提供了有效的解决途径,然而传统的推荐算法越来越难以从当前稀疏的用户数据中提取到有用的信息。如何有效挖掘这些稀疏数据中存在的有用信息,成为了当前推荐系统面临的一个主要挑战。推荐系统在提供便捷的推荐服务的同时也面临着严重的隐私泄露问题。差分隐私作为一种能够提供更加严格和可量
致密砂岩气是非常规油气的重要组成部分,是当前沉积储层的研究热点之一。确定致密砂岩储层的沉积—成岩特征至关重要,储层分类评价是寻找优质储层的必经之路。鄂尔多斯盆地是中国重要的含油气盆地之一,以致密储层为主,因此需要加强致密砂岩储层的研究。本文利用岩心观察、钻测井分析、普通薄片、铸体薄片、扫描电镜、阴极发光、X衍射、能谱分析、物性分析、压汞分析等分析测试手段,系统研究了二叠系石盒子组致密储层的沉积—成
随着科技的不断进步,现代战争中电子战占据的地位越来越重,现在往往只要摧毁敌方的雷达探测系统,就能获得整场战争的胜利。电子战分为雷达侦察、雷达干扰、电子摧毁等几部分,其中雷达干扰能够让敌方雷达失去目标探测能力,从而无法检测到我方战斗机、导弹等战略武器,所以雷达干扰的重要性尤为突出。雷达干扰同样分为好几个部分,包括干扰样式的产生及选择,干扰策略的选择等。在实际情况中选择正确的干扰样式和干扰策略尤为重要
空间数据现势性问题日益突出,已经引起了广大用户和政府部门的高度关注。因此,空间数据更新已经逐渐成为空间数据生产部门的主要任务。为了实现实时快速更新,最大限度的满足人们
随着经济快速发展,产业发展与自然资源之间的矛盾日益尖锐。为了有效评估产业发展对资源环境的胁迫影响,本研究引入环境足迹来表征人类活动的资源消费和环境影响。然而单一的足迹指标只能表征环境影响的某个方面,因此,本文基于投入产出模型和熵值法对环境足迹进行定量集成,从城市、国家和全球三个尺度分析了环境足迹的定量集成和区域转移,以期为产业部门的绿色发展提供科学参考。本文首先基于单区域投入产出模型,对1997-