多通道CartoonGAN下的图像风格动漫化

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:z24514516210
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为解决真实图像转换为动漫风格图像出现的参数量大、图像纹理和颜色损失的问题,提出了一种多通道卡通生成对抗网络(MC_CartoonGAN)。首先,使用HSCNN+(advanced CNNs for the hyperspectral reconstruction task)和遗传算法重新构建多通道图像数据集,丰富图像信息。其次,利用DenseNet网络进行特征复用减少参数的内存占用率及缓解梯度消失的问题。最后,引入多通道颜色重建损失函数,在保证了生成图像内容完整的情况下,降低了生成图像的颜色损失。实
其他文献
对于复杂点云的骨架提取,由于原始点云的遮挡、缺失、分布不均、分支复杂等原因,所提取骨架会产生断裂、拓扑结构错误等问题。针对复杂结构点云的骨架提取,提出了一种基于等级划分的复杂点云骨架提取算法(multilevel divided skeleton extraction,MDSE)。使用L_1-medial提取初始骨架点,将初始骨架点连接成单分支骨架线,通过对单分支结构的初始骨架线进行等级划分,利用
期刊
针对细粒度图像分类问题提出了一种有效的算法以实现端到端的细粒度图像分类。ECA-Net中ECA(efficient channel attention)模块是一种性能优势显著的通道注意力机制,将其与经典网络ResNet-50进行融合构成新的基础卷积神经网络ResEca;通过物体级图像定位模块与部件级图像生成模块生成物体级图像和部件级图像,并结合原始图像作为网络的输入,构建以ResEca为基础的三支
期刊
运用人工智能技术将是构建下一代智慧图书馆的关键,为了实现图书的定位和识别,提出一种基于改进Mask R-CNN的在架图书书脊图像实例分割方法。考虑到图书密集排列、具有一定的旋转性、副本纹理极相似等难点,改进锚框为旋转矩形框,提出旋转区域建议网络取代区域建议网络;提出旋转特征提取方法可减少池化误差且有效提取目标特征,结合掩膜的旋转对齐以提升预测掩膜的准确性。建立了一个包含1 849张在架图书书脊图像
期刊
古代壁画艺术价值高、内容丰富,对壁画种类进行准确分类是研究者的难题之一。传统的壁画分类任务繁重且需要有经验的研究者完成;现有的图像分类算法已不适于分类含有较强背景噪声的壁画图像。针对以上问题提出了一种新的多通道可分离网络模型(multi-channel separable network model,MCSN)的解决方案。以GoogLeNet网络模型为基本框架,用小卷积核对壁画背景特征进行浅层提取
期刊
航拍图像目标检测存在多尺度目标检测精度低、检测速度慢、漏检和误检严重等问题。针对这些问题,提出一种融合卷积注意力机制和轻量化网络的目标检测算法(pro-YOLOv4),并应用于多尺度航拍图像目标检测。首先,利用K-means聚类算法对航拍数据集进行聚类分析并优化锚框参数,以提高对目标检测的有效性;其次,采用轻量级网络结构,精简网络复杂度,提高检测速度;最后,引入卷积注意力模块来解决复杂场景对于航拍
期刊
为了平衡跟踪器的分类与估计模块间的性能差距,提出一种模块性能均衡的跟踪器。首先,通过大量离线学习,将高阶特征纳入目标估计中;然后,对目标估计模块进行训练,预测目标对象与估计跟踪框之间的重叠。为了提高所提分类模块在面对干扰物时的鲁棒性,引入在线训练的分类模块,采用了难分样本挖掘方法,确保较高的区分能力。在OTB100、VOT2016和TrackingNet三个公开数据集上进行实验,结果表明,与相关滤
期刊
彩色图像引导的深度图像超分辨率方法通过利用高分辨率彩色图像的高频信息来重建深度图像,取得了不错的重建效果,但当深度图像和彩色图像边缘不(完全)一致或彩色区域纹理丰富时,重建图像普遍存在边缘模糊和纹理拷贝问题。针对这一问题,提出一种边缘图像引导的双模式联合三边滤波器(DMJTF)方法。该方法利用单幅低分辨率深度图像构建了一个边缘图像金字塔字典,然后利用MRF模型构建了一个高分辨率边缘图像,该图像确定
期刊
跨年龄人脸识别因其在现实生活中的广泛应用而成为人脸识别领域的热门话题。针对跨年龄人脸识别精度较低的问题,引入解纠缠表示学习,提出了一个基于生成对抗网络的解纠缠表示学习(IPDRL)网络来实现人脸图像的识别。该网络由编码器、生成器和鉴别器构成。编码器在对特征中的年龄变化进行解纠缠的同时,对人脸图像的身份信息进行编码,提取只利于身份鉴别的特征,实现身份特征和年龄特征的解纠缠;生成器根据输入的年龄特征生
期刊
针对低分辨率模糊图像实施超分辨率重建后出现大量伪影和边缘纹理不清晰问题,提出了一种双分支融合的反馈迭代金字塔算法。首先采用不同的分支模块分别提取低分辨率模糊图像中潜在的去模糊特征和超分辨率特征信息;然后采用自适应融合机制将两种不同性质的特征进行信息匹配,使网络在去模糊和超分辨率重建模块中更加关注模糊区域;其次使用迭代金字塔重建模块将低分辨率模糊图像渐进重建为逼近真实分布的超分辨率清晰图像;最后重建
期刊
针对当前的图像字幕方法只能够用一种黑盒的、从外部难以控制的架构描述图像的问题。创造性地将图像字幕问题转换为seq2seq问题,达到了可控生成图像字幕的效果。设计一个由图像区域构成的实体集合或实体序列作为控制信号,在实体块切换的块哨兵和带视觉哨兵的自适应注意力机制的指导下,将控制信号有规律地输入到双层的长短期记忆网络(long short term memory,LSTM)中,以可控的方式指导模型生
期刊