【摘 要】
:
近年来,随着电子商务的迅猛发展,服装图像数量直线上升,用户想从海量的服装图像中检索出心仪的服装也愈发困难,如何在数以万计的服装图像中准确地找出消费者想要的服装成为了亟待解决的需求。基于文本的服装图像检索需要手工标注,且具有主观色彩,文本标注也难以完整地概括图像中的所有信息,导致检索结果不尽如人意。而目前兴起的“以图搜图”服装检索技术依赖于图像内容特征来进行检索,虽然避免了人工标注的困扰,但难以突出
论文部分内容阅读
近年来,随着电子商务的迅猛发展,服装图像数量直线上升,用户想从海量的服装图像中检索出心仪的服装也愈发困难,如何在数以万计的服装图像中准确地找出消费者想要的服装成为了亟待解决的需求。基于文本的服装图像检索需要手工标注,且具有主观色彩,文本标注也难以完整地概括图像中的所有信息,导致检索结果不尽如人意。而目前兴起的“以图搜图”服装检索技术依赖于图像内容特征来进行检索,虽然避免了人工标注的困扰,但难以突出服装局部区域中图案、花纹等细节特征,也存在部分图像信息丢失的问题,导致检索准确率不高。本文依托课题组的服装检索系统为背景,使用深度学习方法实现对服装图像的准确检索。本文的主要工作如下:(1)提出了一种基于混合注意力机制的服装图像特征提取网络。针对服装图像具有大量的语义信息和细节信息,大多数卷积网络提取的特征都是服装图像的整体特征,缺乏凸显服装局部特点特征的问题,本文提出一种基于混合注意力机制的特征提取网络CSP-Net,通过引入混合注意力机制来加强服装重要区域中的花纹、图案等局部细节特征的关注,强化特征表达。(2)对CSP-Net网络的损失函数进行了优化。在仅使用交叉熵损失函数的基础上加入三元组损失,使得网络能够加强对差异性较小的服装样本的训练,强化对细小差异图像的识别能力,提升对不同服装图像特征的辨识性。实验结果表明,加入三元组损失后的网络的查准率和召回率比仅使用交叉熵损失函数的网络高出1.9%和2.2%。(3)提出了一种基于多层特征融合的服装图像检索模型。CSP-Net在得到服装图像整体特征的基础上加强了对服装局部区域中图案、花纹等细节特征的关注,但同时也弱化了网络提取到的底层颜色、纹理和中间层款式细节等图像细节信息,存在部分图像信息丢失的问题。因此,我们进一步提出了一种基于多层特征融合的服装图像检索模型MF-CSPNet,该模型提取了CSP-Net网络的底层、中间层的图像细节信息与高层的语义信息,利用多尺度卷积核方式进行特征融合,在融合多层特征的同时提取到不同尺度大小的特征,使提取到的图像特征更加全面,实现服装图像的准确检索。实验结果表明,提出的服装图像检索模型的查准率、召回率和top-5准确率比没使用特征融合的CSP-Net分别高出2.4%、2.7%、2.8%。(4)最后,结合本文所提出的服装图像检索模型,构建了一个服装图像检索系统,该系统能够有效地处理大量的服装图片,提高了服装图像检索的智能化程度。
其他文献
高光谱图像包含丰富的光谱和空间信息,且具有较高的光谱分辨率,图谱合一的特性使得高光谱图像在对地遥感观测等研究领域中,表现出较高的应用价值。然而,复杂的地物分布和有限的图像空间分辨率所引起的混合像元问题,往往限制着高光谱图像实际应用的准确性。为了从高光谱图像中提取更精细的信息,为后续研究和应用提供更精确的数据参考,光谱解混成为了高光谱图像处理中的一项关键技术,旨在提取构成高光谱图像每个像元的纯物质端
生物体内存在一套复杂的基因调控机制,这种调控机制控制生物的生长发育过程,研究者将这种调控机制定义为基因调控网络(Gene regulatory networks,GRNs),基因调控网络是理解生物系统的重要工具。随着单细胞测序技术的快速发展,单细胞转录组学数据的规模越来越大,准确的从大规模转录组学数据中推断基因调控网络对于理解生物调控过程至关重要。近年来已经有研究者提出了大量算法对基因调控网络进行
社区指的是网络中内部连接紧密但与外部连接稀疏的子网络。k-core社区是指图中的一个连通子图且该子图中的每个顶点的度都大于等于k。由于k-core社区可以在线性时间内求解的特点常被用于其他社区结构的求解。当前对于k-core社区的搜索主要是通过KHT(k-core hierarchy tree)索引来实现,该索引通过将图遍历转化为树遍历来加快查询速度,但在查找目标社区时,依旧存在遍历效率低的问题,
某炼油化工企业汽车成品油装车油气回收装置在运行过程中因为吸收塔压力高,导致装置联锁停车。通过对变量记录的分析,找到了事件发生的原因,并在控制措施落实等方面给出了对策和建议。
社区是数据图中符合一定结构及紧密程度要求的子图。社会学中的关系网络,生物学中的蛋白质网络等网络中都存在着联系紧密的社区。社区搜索的目标是从图中得到符合定义要求且包含查询顶点的社区,社区发现的目标是从图中获得所有符合定义要求的社区。实际应用中用户对社区结构有着多样化的需求,现有的基于子图连通性的社区定义主要是以完全连通子图作为社区的基础连通结构,通用性不足。针对以上问题,本文给出了相应的解决方案,主
本文根据天津市旅游业发展的最新指导性政策与京津旅游资源分布差异,天津市河北区在近代历史文化旅游资源方面,从类型、分布、特色、数量、现状和市场多角度与和平区对比,对开发利用中的问题与短板做了细致的调研,本文据此结合《天津市促进旅游业发展两年行动计划》,对河北区近代历史文化旅游资源如何进一步开发提出建议。
服装是人们日常生活的基本需要,同时也是人们展现个性的重要途径。近年来随着各种网络购物平台的崛起和深度学习技术的不断发展,服装领域出现了服装推荐、搭配、分类和虚拟试衣等新兴应用。作为实现这些应用的关键技术,服装解析可将服装图像分割成多个部分并为每个像素分配对应的标签,从而为后续的服装特征提取、分类和推荐等提供精确的语义分割结果。由于服装图像具有较复杂的款式、纹理和风格,且存在背景繁杂、人体姿态多变和
船舶检测广泛地应用于海事领域,对航行安全、航运贸易、水域管理和船舶调度起到十分重要的保障作用。针对当前主流的物理射频信号船舶检测方法难以发现重点水域的非法船舶和伪装船舶,本文依托课题组和上海顶亮光电科技有限公司合作的嵌入式船脸检测项目,研究适合部署于边缘设备的、基于计算机视觉的船脸检测网络,并基于该网络研发一个船舶检测管理系统原型。首先,本文提出了一种改进的YOLOv4船脸检测网络。首先通过替换骨
在对于脑部疾病的研究过程中,人们发现可以通过将大脑划分成若干个脑区定义为网络节点,并将脑区间的某种连接关系定义为边,得到“脑网络”的概念。随着对脑影像的深入研究,产生了许多不同的脑网络,接着,使用图论的知识对其进行解读,并对大脑的结构或功能连接及二者之间的联系进行进一步的探究。弥散张量成像(DTI)通过检测水分子在白质纤维中的扩散情况,可以反映大脑中白质纤维的走向。而功能磁共振成像(f MRI)通
随着我国科学技术不断的发展和进步,信息技术以及计算机在当前的企业管理当中被广泛使用。传统的针对会计方面的管理工作已经无法适应当前时代的潮流,逐渐地向信息化管理模式靠拢,能够有效地推动企业会计信息化建设进程。当前我国各个企业在会计工作信息化建设当中虽然有一定的成效,但是整体上来看,仍然有一定的弊端,所以需要加强会计信息化建设,从而保证企业能够顺利发展。文章针对企业在会计信息化建设过程当中所遇到的问题