注重风格化质量的图像及视频风格迁移技术研究

来源 :天津大学 | 被引量 : 0次 | 上传用户:johnnywong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
风格迁移是一个图像合成问题,其中一幅图像的内容与另一个图像的风格合成新的图像。风格化的图像或视频在内容结构上是内容图像的展现,在风格展现上则是以艺术绘画的形式。风格迁移结果的评价指标包括效率、灵活性、质量等。效率是指每个风格化结果的产生所消耗的时间,灵活性是指训练的模型可以处理的数据量,质量则是从风格信息出发,以不同的角度来评估产生的结果。本文主要针对图像和视频风格化的结果质量进行深入研究,从结果的结构保存方面进行改进。目前针对图像风格迁移的灵活性和效果的研究有了显著进步,然而现有的方法通过高层次特征提取获得高质量的风格化结果,容易导致风格化图像发生扭曲、内容结构不清晰及边界模糊失真。为了解决上述问题,本文提出一种结构保留的任意风格迁移网络。通过改进的边缘检测网络指导风格迁移实现,成功抑制风格化结果结构扭曲并同时保留语义内容。同时,引入全局内容损失和局部区域结构损失,通过不断迭代处理、优化参数,加强网络对图像特征之间的学习,保证结构完整性及局部细节保留。本文提出的方法不仅对于保存细节的任意的风格迁移有效,而且对于真实场景和曝光场景下的图像处理也都适用。针对目前视频风格迁移领域视频帧结构保存、防止结构扭曲导致用户难以辨认以及视频闪烁、伪影等问题,本文提出一种新颖的视频风格迁移网络。首先,对于视频帧的结构保存问题,本文继承了图像风格迁移的网络,利用自适应实例化,对视频帧进行特征空间的均值与方差的匹配,并利用边缘特征作为指导完成视频帧处理。其次,针对视频画面闪烁、伪影严重等问题,并确保时空一致性,实时生成时间上连贯的风格化视频序列。本文提出了长期、短期时间损失函数对视频帧进行学习,探索视频帧之间的相干性。实验结果表明,本文的方法能有效地实现具有稳定结构的视频风格迁移效果。
其他文献
随着科技的发展,人们对社会公共安全的关注度逐渐提高,使得世界各地政府和学者在智能安防领域投入大量精力。安防系统无论是在民用还是在军用都有着不可或缺的地位,而安防最重要的手段之一就是视频监控技术。近年来,有很多学者在行人属性识别领域进行研究,也取得了很大的进展,从最初的手工设计特征结合传统机器学习方法到现在的深度学习算法,行人属性识别技术水平也在不断提高。但是目前大多数的研究都是基于单张图片进行的,
学位
2023年2月,“流浪气球”事件在海外社交平台广泛传播,引发双方外交互动及舆论交锋。推特成为双方舆论交锋的主要场合,中美主流媒体均在此发布大量观点性推文。作为政治意味较为浓厚的海外社交媒体,推特具有“西强我弱”与“众说纷纭”两个基本特点。基于对该事件的分析,中国媒体应重视在海外社交媒体发声,澄清事实真相;内容为王图文并茂,打破西方媒体母语优势;正视美国社会问题,避免敌对心态。未来,应从内容扩展和平
期刊
[研究目的]在以俄乌冲突为代表的网络舆论战中,各方力量在舆论场上为战争造势,使得舆论场势力混杂、信息来源复杂、水军搅局、舆论群体极化、情感和情绪色彩浓厚,是一场具有鲜明特色的社交媒体舆论战争。通过情感因素的研究,有助于分析社交媒体时代舆论战的新特征和新趋势。[研究方法]基于情感实践和媒介学的研究成果,结合对俄乌舆论战进行案例分析,研究情感对于社交媒体时代舆论战的影响。[研究结论]研究发现,在社交媒
期刊
统筹发展和安全的基本内涵是实现高质量发展和高水平安全的良性互动,以高质量发展促进国家安全体系和安全能力现代化,以高水平安全防范化解发展中的风险挑战,确保经济社会发展的健康推进。统筹发展和安全作为理论逻辑、历史逻辑与现实逻辑的辩证统一,开拓了马克思主义政治经济学新境界,根植于中国共产党的百年历史经验,是党治国理政的一个重大原则,也是新时代党和国家事业发展的战略部署之一。在以中国式现代化推进中华民族伟
期刊
推荐系统往往面临着数据稀疏和冷启动两个问题。为了缓解数据稀疏性和冷启动问题所带来的不良影响,本论文使用知识图谱来提供辅助信息,帮助推荐系统在数据稀疏和冷启动的情况下也能得到良好的推荐效果。知识图谱中的信息以图网络结构的方式相互联系,使用起来比较困难,为了更好地使用知识图谱中的有用信息,本论文尝试寻找有效的手段去充分利用知识图谱,从而辅助推荐系统更好地运行。总的来说,本论文的工作主要包括以下三方面内
学位
近年来,基于声学信号的自动语音识别技术的识别效果已经有了很大提升,但是在一些复杂的实际应用场景中,其性能会有大幅下降,或根本无法使用,如在养老助残、高噪声、隐私保护、外太空等场景中。而本文所研究基于非声学信号的无声语音识别(Silent Speech Recognition,SSR)则没有相关限制,在众多领域都能有广泛的应用前景。本论文围绕基于面部表面肌电信号和唇部运动图像的无声语音识别方法及其融
学位
近年来,深度强化学习在不同产业应用中取得了很大的成功,特别在游戏领域,通过深度强化学习算法训练的非人类玩家在各方面都有超过人类玩家的表现。在机器人运动控制的深度强化学习研究中,多机器人协同作业的深度强化学习研究是未来发展无人系统的核心内容。但目前多无人系统运动控制的深度强化学习研究面临状态和行为空间维数高、状态信息误差大以及样本量少的问题,为解决这些问题科学家提出了融合先验知识和虚实结合等策略的机
学位
随着科技迅速的发展以及智能手机的广泛普及,人们的生活已经离不开移动应用程序。然而移动应用程序随时都会访问用户的个人隐私数据,这会对用户的个人信息安全造成侵害。如今世界各国的用户和政府开始关注个人隐私信息的保护,要求移动应用程序必须提供隐私政策供用户去阅读,隐私政策作为移动应用程序服务提供商向用户展示他们是如何收集、使用、披露和管理隐私数据的文本,其冗长且难以理解,用户们通常选择忽略。本文首次提出以
学位
本文通过对老虎沟门地区土壤地球化学异常特征进行分析,发现Au、Ag、Pb、Zn是区内的主要成矿元素,而Bi、Sb、Mo等是重要的成矿伴生元素。区内各元素土壤地球化学异常套合较好,结合地质特征圈定了6个综合异常区,综合异常区的展布及异常浓集中心与韧性剪切带、蚀变破碎带、石英脉等密切相关。经工程验证,Ⅰ号综合异常区石英脉内发现两条金矿化体,Ⅳ号综合异常区韧性剪切带内发现金(锌)矿化体、Ⅵ号综合异常区石
期刊
近年来,许多深度强化学习算法被提出,并且成功地应用在了各种时序决策领域中。然而,深度强化学习算法仍存在一些尚未解决的问题:在探索空间巨大,奖励信息较为稀疏的任务中,智能体很难探索到有效信息;数据利用率不高,训练时间长,难度大;对于超参数设置敏感;无法引入外部知识等问题。与智能体在学习策略时的随机探索不同,人类在处理任务时大多会依据相关知识及经验,在路径搜索方面更具有方向性及优势。因此,越来越多的工
学位