融合视觉注意机制的图像显著性区域风格迁移方法

来源 :计算机工程与科学 | 被引量 : 0次 | 上传用户:lxm1230520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对图像局部进行风格迁移通常会导致风格溢出和较小的区域风格化后效果不明显,针对该问题,提出一种图像显著性区域风格迁移方法.首先,根据人眼视觉注意机制的特点,对训练图像数据集中的显著性区域进行标注,采用快速语义分割模型进行训练,得出包含图像显著性区域的二值掩码图.然后,通过精简快速神经风格迁移模型网络层结构,并在生成网络部分采用实例正则化层,得出更具真实感的整体风格迁移结果.最后,将由语义分割得到的二值掩码图和整体风格迁移图相融合,输出最终的结果图像.在Cityscapes数据集和Microsoft COCO 2017数据集上设计了对比实验,结果显示,该方法对图像中的局部目标区域进行了均匀、细腻的风格化,且与背景区域能很好地融合在一起,实现更具真实感的风格迁移效果的同时,运行效率更占优势.
其他文献
研究自由空间激光通信网络移动节点的拓扑控制问题,针对特定场景空间激光通信自组织网络提出一种基于集合划分的启发式拓扑算法.根据空间节点的位置姿态信息和激光建链的约束条件计算节点间的可连接关系及链路稳定度,通过启发式迭代生成较优的全连通稳定拓扑,实现所有节点间的网络层通信.所提算法不仅可优化网络直径,还可在遇到链路断开时,通过集合合并进行拓扑修复.仿真结果表明,拓扑稳定度和网络吞吐量符合优化预期,拓扑遇到中断时可成功修复,且不同节点规模下的算法执行时间符合弗洛伊德算法时间复杂度O(n3).
随着嵌入式设备性能的提升和功能的不断扩展,单操作系统架构已经难以满足越来越复杂的应用需求,因此学术界和产业界提出了双操作系统架构.然而,如何合理地配置有限的外设资源是双操作系统架构面临的一个重要问题.基于华为海思Hi3559AV100 SOC双操作系统架构中外设中断与CPU核的绑定原理,提出一种外设资源在系统运行期间可以动态迁移的解决方案,并在搭载该SOC的嵌入式开发平台上进行了实验验证.实验结果表明,该方案具有较好的可行性和可靠性.
常规小波软阈值去噪方法处理前后的图像小波系数有所差异,导致去噪后图像失真严重.为进一步提升去噪效果,提高去噪和细节保持能力,对阈值的选取方式和阈值函数进行改进.改进方法通过小波变换的每一级子带长度确定阈值,实现阈值自适应准确量化,改进软阈值函数采用双曲正切函数替换符号函数,对阈值绝对值范围内的小波系数应用非线性函数进行逐步压缩,使改进的阈值函数连续性更好,稳定性更强.实验结果表明,改进的小波软阈值去噪方法的峰值信噪比平均提升了48%,结构相似度平均提升了80.6%.相比常规小波阈值去噪方法,新改进的小波软
针对数据中心难以适应流量增长进行横向扩展并保证连接一致性的问题,阐述了四层负载均衡技术在应对高并发访问和提高资源利用率方面的重要作用,梳理了国内外四层负载均衡模块的设计与算法,总结了负载均衡器以不同方式进行部署分别存在的优缺点,同时分析了网络可编程转发技术在四层负载均衡领域中的应用与最新进展.最后,对网络新形势下负载均衡技术的发展进行了进一步展望并讨论了未来的研究方向.
当前图像标题生成任务的主流方法是基于深层神经网络的方法,尤其是基于自注意力机制模型的方法.然而,传统的深层神经网络层次之间是线性堆叠的,这使得低层网络捕获的信息无法在高层网络中体现,从而没有得到充分的利用.提出基于残差密集网络的方法获取层次语义信息来生成高质量的图像标题.首先,为了能够充分利用网络的层次信息,以及提取深层网络中的各个层的局部特征,提出LayerRDense在层与层之间进行残差密集连接.其次,提出SubRDense,在Decoder端的每层网络中的子层中运用残差密集网络,以更好地融合图像特征
忆阻器可以将信息存储和逻辑运算整合到一个电子器件上,这将打破传统的冯·诺依曼计算机架构,其应用前景不可估量.首先简述了忆阻器的发展历程及其基本概念;其次综述了忆阻器的阻变机制及其材料的选择,将目前已知的阻变机制主要概括为3类,即阴离子阻变机制、阳离子阻变机制和纯电子机制,同时详细叙述了不同类型材料在忆阻器应用中的特点;然后论述了忆阻器在布尔逻辑计算以及神经形态系统方面的应用;最后展望了忆阻器未来的发展方向并总结了其在实际研究中仍未很好解决的难题.
手机电脑平板等的普及,使得照片在日常生活中更容易获得,并且人们习惯将大量照片存储在云端.但是,在享受云存储带来的便利的同时,用户也容易受到隐私泄露的威胁.虽然学者们设计出许多图像加密方案用来防止隐私泄露,然而往往忽略了图像的可用性.最近,T ajik等人提出了一种精确缩略图保持的加密方案,能够很好地平衡图像的隐私与可用性.但是,该方案在加密过程中仅以2个像素为一组,效率较低.为此提出一种利用分割法加密图像的方案,该方案以3个像素为一组进行加密,用于保持密文图像的缩略图与明文图像的缩略图一致,并且该方案相比
智能手机拍摄的图像中经常会出现变形的文档图像,变形的文档图像影响文本的识别和后期图像处理等工作,而现有的变形文档图像校正方法存在校正类型单一和校正效果不理想的问题.针对以上问题,提出了一种基于最小化重投影的变形文档图像校正方法.该方法首先通过文本域轮廓检测,合并文本域轮廓来获取文本行连通域.然后利用主成分分析法PCA在行连通域生成文本关键点.最后通过最小化关键点和其投影点之间的距离获取重采样参数,再对变形的页面进行最小化重投影来进行文档图像校正.校正后识别率得到有效提高,相比现有方法,所提方法取得了更好的
随着智能设备的不断出现,图像数量急速增加,但是很多图像因为没有被标注所以未被充分利用.为了能够使该问题得到较好解决,提出了基于LDA和卷积神经网络的半监督图像标注方法.首先把图像训练集中的所有文字信息放入LDA中,生成图像的文字标注词;然后使用卷积神经网络获得图像的高层视觉特征,同时用加入注意力机制和修改损失函数的方法来对卷积神经网络进行优化;接着把LDA生成的标注词和已获得的图像的高层视觉特征进行结合并同时使用半监督学习来完成模型的训练;最后把标注词间的相关性和使用最终模型预测的结果相结合来完成图像的最
在网速飞速提升、内存瓶颈突出、网络处理开销愈发显著的时代,普通网卡在网络协议处理、数据搬移、使用灵活性等方面逐渐暴露出缺陷.智能网卡,作为可编程的智能网络设备,在数据中心、科学计算领域均得到广泛关注,成为解决网络瓶颈的关键技术.在网络协议处理卸载、网络功能虚拟化、特定应用加速等应用场景中发挥着重要作用.综述从智能网卡的基础架构、编程框架、应用方向和热点问题4个方面进行分析,总结了目前产业界中的典型产品、学术界中的重要成果,明确了不同设计架构的优势和不足,分析了不同编程框架适用的应用场景,介绍了智能网卡在典