基于深度学习的服装检索技术研究

来源 :中国石油大学(华东) | 被引量 : 0次 | 上传用户:MAOTRON
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务和网络购物平台的蓬勃发展,在线商品购物在人们的生活中显得至关重要,因此服装市场潜在着巨大的商业价值。在线商城中的服装类别繁多且数量巨大,目前存在的电商购物平台中,大部分还是通过传统的方法来检索图像,比如关键字或文本等,此类方法的本质是以文搜图。然而面对海量的服装图像数据,人工标注关键字进行服装检索的方法渐显疲态,如何有效地对网络服装图像进行检索显得尤为重要。和简单的文字描述相比,服装图像包含更多的纹理、颜色等视觉信息。依据图像的语义级别的信息,从图像的数据库中检索出来与待查询图像具有很多相似特点的其他图像,即“所见即所得”,此类方法的实质是以图搜图。服装检索技术有两个重要的分支,其中之一是在线商城图像之间的相似检索,另一个是跨域服装检索。所谓跨域指的是待检索图像与来自数据库中的其他服装图像来自两个有差异的场景,例如日常街拍图像查询在线商城的服装图像。当前针对跨域服装检索技术主要面临的问题涵盖如下几个方面:1)服装商品品类繁多,纹理、材质等属性信息比较复杂;2)通常服装商品图像拍摄在背景纯净、光照条件良好的特定场景,而用户图像不可避免地存在背景复杂、姿态多变、遮挡等问题;3)服装图像属于低层特征,用户需求属于语义级别的高层特征,两者之间有很大的差异。针对目前服装检索技术中遇到的主要问题,本文提出了新的服装检索方法,主要的研究内容如下:1.服装部位检测算法的研究。对于服装的检索技术,服装部位的检测和分割十分的重要。本文在服装检索中运用Faster R-CNN和FCN(fully convolutional neural network)结合的方式进行服装区域的检测和分割,消除了复杂背景对服装图像技术的影响。2.服装区域特征描述子的研究。对于商品检索任务,如何获取更具判别性和鲁棒性的特征是研究重点,本文引入注意力机制,将卷积层特征分配不同的权重,能够更好地学习表述服装图像的重要特征,抑制不重要特征。3.大规模服装库下精确检索算法的研究。通过联合分类损失和三元组损失函数进行端到端的网络训练,类别信息约束检索过程减少类间差异性小的问题。通过与服装检索相关工作进行大量的对比实验,验证了本文所提方法的优势。
其他文献
近几年来随着社会的高速发展及人们生活的提高,汽车逐渐普及,因此,对车辆行驶安全问题有了更高要求,道路交通标识的自动检测与识别在安全驾驶中的作用也越来越重要。基于交通标识的道路驾驶辅助系统的出现,不但能减少驾驶人员的精神压力,也能大大避免交通事故的发生。交通标识的识别就成为道路驾驶辅助系统实现过程中的关键一环,及时、准确识别汽车行驶过程中的交通标识,可以有效提醒驾驶员因疏忽或者因盲目超速等不良行为而
学位
近年来,随着人们生活质量的逐渐提升,心脏病的发病率急速增加。疾病风险分析技术作为一种常见的预防手段,利用患者健康数据进行患病风险分析,以达到在发病潜伏期对疾病有效干预的目的。然而在实际应用中,患者的健康数据往往带有极强的隐私性,并且数据具有维数较高、线性关系较弱的特点,使得现有的疾病预测模型难以达到最佳效果。因此,疾病风险预测模型的研究是医疗领域的热点,具有重要的理论意义和极高的应用价值。本文以心
学位
传统监控系统广泛应用于油田施工现场的险情监测中,但需要工作人员花费大量的精力查找监控视频中的险情。基于目标检测技术的监控系统,能够自主识别目标,减少对工作人员的依赖,但同时存在对小目标检测不佳的问题。为解决上述问题,本文提出了基于残差网络和改进特征金字塔的SSD算法(Residual Network and Improved Feature Pyramid SSD,RP-SSD)。首先,自主构建油
学位
皮肤病是人类最常见的疾病之一。近年来皮肤病的种类和发病率不断增长,发展成皮肤癌的病例越来越多。全球每年大约有2到3百万的皮肤癌新增病例,严重危害国民健康。皮肤癌的早期诊断和治疗对于患者恢复健康有极大意义。色素性皮肤癌类间相似度高、类内差异化大,给医学诊断工作带来了负担。随着科技的发展,深度学习已经在诸多领域得到了广泛应用,特别是在智慧医疗领域的发展。通过医学图像处理技术,结合计算机的分析能力,辅助
学位
随着计算机时代的发展,图像修复技术已经得到广泛应用,成为计算机视觉领域中的一个重要任务。最近,基于深度学习的方法在图像修复这种复杂问题上已经显示出有希望的结果。这些方法从缺失区域上下文生成语义连贯的补丁,能够生成视觉上可信的图像结构和纹理,但容易产生与周围区域不一致的伪影图像。相比之下,传统的图像修复方法通过复制图像补丁来填充缺失区域,修复效果平滑,但无法学习到图像的高级语义信息。本论文针对目前图
学位
图像翻译是计算机视觉的一个重要研究领域,其旨在学习源域和目标域之间的映射关系,并通过该映射实现特征交换。图像翻译主要分为两大类:基于监督学习的图像翻译和基于非监督学习的图像翻译。基于监督学习的图像翻译主要应用于图像生成、图像修复和图像超分辨率等领域,但这些算法需要大量成对的训练数据集,极大地限制了其应用场景。在实际的图像翻译任务中,获得大量的成对训练数据集需要耗费很大的成本,而且有时候无法获取,所
学位
在移动互联网技术和通信行业快速发展地推动下,位置服务日益受到人们的关注与应用。传统室内定位大多采用单一的定位方式,每种定位方法均存在局限性与不足,已经无法满足用户对高精度定位日益增长的需求。融合定位是指对两种或两种以上的传感器或定位方式采用融合算法进行定位。融合定位可以从一定程度上弥补单一定位方式的缺点,实现多种定位方式的优势互补,从而达到提高定位精度的目的。由于室内环境较为复杂,Wi Fi信号传
学位
员工的工作绩效表现直接影响着企业的效益,提升企业内部员工的工作绩效是企业在激烈的竞争环境中能够脱颖而出的关键,而人力资源质量也已经成为企业核心竞争力的重要标志。精益管理的应用除了要求企业革新传统的员工管理思维外,还要求企业因地制宜地制定具有针对性的精益管理模式,其对于挖掘员工潜力、优化员工绩效管理体系和提升企业经济绩效具有重要的现实意义。本文通过对ZJ公司的实地调查,发现公司当前在尝试应用精益管理
学位
TL公司是一家专业生产非公路矿用车的高新技术企业,国内市场占有率达40%,同时其产品也远销海外,已成为行业的领军者。该企业于2015年在新三板挂牌交易,目前已经进入规模化发展阶段,在此过程中企业原有的绩效考核制度已不能满足企业发展需求,急需建立一套与其战略目标相符的、完善的、科学合理的业绩考核体系。本文以TL公司绩效考核制度为研究对象,发掘原有绩效考核体系的优势与不足,运用平衡计分卡完善公司整体绩
学位
随着计算机视觉和图形图像技术的发展,三维模型在各个领域得到了广泛的应用,三维重建技术成为研究热点。重建数字岩心能够促进地质勘探和油气开采工作,对经济发展有着重要的意义。针对传统的数字岩心建模方法建立的数字岩心模型尺寸单一,分辨率固定,导致数据量过大,难以维护等问题,提出一种分层四叉树结构,基于分层四叉树构建多分辨率数字岩心,并在面模型生成、岩心切片模板匹配等方面进行优化,同时据此设计编写数字岩心重
学位