基于图像融合的二维虚拟试衣方法与软件

来源 :华中科技大学 | 被引量 : 0次 | 上传用户：alicial

【摘要】

：

【作者】

：

王紫璇

【机构】

：

华中科技大学

【出处】

：

华中科技大学

【发表日期】

：

2023年01期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

二维虚拟试衣技术利用服装与人体图像合成虚拟试衣图像的方式来模拟服装的试穿效果。当前主流技术手段利用人体的体型姿势信息对服装图像进行扭曲变换,弥补服装与人体间的空间错位,然后再将扭曲服装与人体图像进行融合得到合成图像。然而,空间错位是无法完全消除的,人体与扭曲服装之间的未对齐区域会在融合过程中混入无关纹理,从而在合成图像的服装区域造成模糊和伪影。因此,如何解决上述问题是二维虚拟试衣领域面临的重要挑战。针对上述挑战,本文提出了一个基于通道注意力和未对齐区域归一化的图像融合网络。针对纹理模糊问题,引入通道注意力机制来自适应地调整人体与服装特征图通道间的权重,强调特征图中的服装纹理信息,实现了合成图像的服装纹理细节保留。针对伪影问题,建立了基于未对齐区域和目标人体分割图的归一化层,利用人体语义信息对特征图中的不同位置分别学习其仿射变换参数,能够指导未对齐区域的服装纹理合成,实现了合成图像中人体语义布局的保留,避免未对齐区域产生伪影。实验表明,在公开数据集MPV3D上,本文提出的图像融合网络在合成图像的结构相似度、学习感知图像块相似度以及frechet inception距离等指标上均优于基线方法VITON,性能指标分别提升了3.5%、59%和26.9%。在主观效果上,本文方法生成的合成图像具有更加逼真的服装纹理。基于上述工作,本文设计与实现了一个基于客户端-服务器架构的虚拟试衣软件。用户可以在移动客户端选择自身照片以及待试穿服装图片上传至服务端;服务端接收到上述图片后,利用本文方法生成虚拟试衣图像并返回和呈现在客户端上。

其他文献

肥胖与甲状腺抗体、高促甲状腺激素血症及高尿酸血症的相关性分析

第一部分肥胖与甲状腺抗体及高促甲状腺激素血症的相关性分析目的分析肥胖与甲状腺抗体及高促甲状腺激素血症的关系,比较不同肥胖指标对甲状腺抗体及高促甲状腺激素血症的预测价值。方法采用整群随机抽样方法,在湖北省武汉市华中科技大学社区和宜昌市夷陵区抽取居民2698人为调查对象。受试者的年龄包括18岁及以上。对每个受试者进行问卷调查和体格检查,同时测定了促甲状腺激素与抗体、血糖、糖化血红蛋白、血脂和尿酸等血液

学位

论广播权的权利范畴

2021年新《著作权法》对广播权制度的修改,在一定程度上弥补了之前我国传统广播权制度的不足,使其与信息网络传播权的关系更加协调,体现了技术中立的立法原则,且在权利控制范畴上有所扩大,使广播权制度更加科学,但有关广播权的权利范畴并不明确。本文将采取历史研究和比较研究的方法,梳理传统广播权制度向综合广播权制度演变的历程,并将广播权与信息网络传播权以及其他传播作品的专有权利做横向比较,揭示出我国广播权权

学位

基于蓝牙单基站的目标定位研究

近些年来各种定位技术层出不穷,例如Wi Fi定位、超带宽（Ultra Wide Band,UWB）定位等等。以上技术通常需要部署多个基站。近年来,一些特定场合提出了轻量级、单基站部署的定位需求,以减少定位系统部署的负担。本文基于蓝牙信号,提出了一种基于蓝牙单基站的测向-测距-测速的联合定位方法。此外,考虑到可穿戴定位标签中通常已包含低成本、低功耗的惯性测量单元（Inertial Measureme

学位

历史城区整体保护的景观方法——以武汉历史城区（武昌片区）为例

21世纪以来,城市化以前所未有的速度推动了城市发展,改变了历史城区的整体环境,历史保护与城市发展的矛盾日益突出,产生了一系列文化遗产保护问题。作为我国城乡历史文化的重要载体,历史城区的整体保护具有重要的意义和使命,在中华文明体系中扮演重要的角色,同时也逐渐成为推动城市创新发展的动力。在新时代的背景与需求下,如何整合历史城市的历史空间资源,化解保护与发展的矛盾,使历史城区以一个整体的方式,融入现代城

学位

面向异常检测的学生网络高效学习与推理算法研究

随着我国经济的高速发展和科技水平的提高,异常检测技术在工业质检、视频监控等领域扮演着越来越重要的角色。目前,随着计算机视觉技术的发展,异常检测技术也在不断取得突破。然而,现有算法仍存在许多问题亟待解决,如计算量较大,难以满足实时性需求;模型需要大量的样本及时间进行训练,难以满足实际场景需求。本文充分调研了异常检测、高效学习等领域的相关研究,对异常检测任务中存在的问题进行了探究,主要工作内容及创新点

学位

轻量化语义分割深度学习主干网络设计和搜索

计算机视觉领域,图像语义分割是热点研究问题之一,其研究成果被广泛应用于自动驾驶、智慧医疗等场景。在一系列算法中,基于深度学习的语义分割算法是目前的主流。在算法实际部署的过程中,业界对轻量级语义分割网络的需求愈发迫切,针对计算资源受限场景下的语义分割主干网络设计是其中的一个研究方向。主干网络在深度学习算法中扮演着重要角色,主要用于提取输入图像的信息,为下游任务提供多尺度特征。Transformer网

学位

面向噪声标签场景的医学图像分割方法研究

近年来深度学习方法在医学图像分割领域取得了显著成效。然而,深度学习分割模型的性能高度依赖于训练样本的标签质量。医学图像的像素级标注依赖于专家的经验,十分耗时且容易出错,导致训练样本不可避免存在大量标签噪声,严重影响分割模型的性能。如何消除标签噪声对分割任务的干扰仍面临挑战,是目前的研究热点方向。医学图像分割场景中的标签噪声主要包含两类:1)由标注者的疲劳或粗心导致的随机标签噪声;2)由于目标结构复

学位

车辆多模态视觉感知系统的设计与开发

在新一轮科技革命和产业变革的背景下,快速发展的计算机技术与传统汽车行业深度融合,智能汽车成为产业发展的战略方向。作为智能驾驶关键技术中的数据前端,车辆感知系统利用多种传感器收集数据,并以此为基础进行算法分析,提取有价值的外部环境信息,供车内乘员及辅助驾驶系统做出驾驶行为决策。本文主要研究设计和实现一个车辆多模态视觉感知系统,选用可见光与红外摄像头作为视觉传感器,以此为基础实现像素级和语义级的外部环

学位

移动端实时人体实例分割算法研究及部署

人体实例分割旨在对图像中的每一个人体都给出像素级的识别结果,是计算机视觉领域的一个重要研究问题,在手机等移动终端上具有良好的应用价值。本文基于业内主流的Yolact方法设计了一种能在移动终端实时运行且具有较高精度的人体实例分割算法,命名为Yolact Mobile,算法主要做了两个方面的改进:（1）针对多尺度人体特征难以准确表达的问题,本文在主流的人体实例分割模型Yolact框架基础上提出了更优的

学位

基于稀疏直接法的视觉-雷达里程计和地图重建

基于视觉与雷达融合的即时定位与重建技术（Simultaneous Localization and Mapping,SLAM）,是室外场景位姿估计和建图的主要技术手段之一。它融合了相机和雷达两方面的优势,一方面利用相机获得较高的输出频率,另一方面利用激光雷达直接获取大范围的场景结构信息。然而,现有融合方法的视觉模块（即深度增强视觉里程计）大多采用特征点法。但是,基于图像信息提取的2D特征点和激光雷

学位

基于图像融合的二维虚拟试衣方法与软件

与本文相关的学术论文