图像的表象编辑和合成技术的研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:djdyaqb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
图像编辑是图形图像处理领域的重要研究内容,无论是在影视、传媒、文化和艺术等领域,还是在人们的生活中,都有着广泛的应用。其中,有两种使用很广泛的编辑技术,一直在国际上得到热烈的研究,它们是表象编辑(appearance editing)和图象合成(image composition)。图像的表象编辑是指对图像的颜色、光照、曝光度、饱和度、纹理和噪音等表象元素进行编辑,以增强图像的视觉质量,或更好地满足用户表达情感、传递个性化的审美诉求。而图像合成则是通过对不同图像的内容进行重组,创造出从内容上完全不同的新图像。对于这两种技术,本论文主要研究如何让用户能更方便、更快速且高质量地进行处理,以提高这些技术的应用价值。其主要贡献归纳如下:   (1)针对现有的编辑扩散(edit propagation)方法速度普遍慢的问题,提出了一种实时的编辑扩散的方法,能够让用户更方便、快速地对图像的表象进行编辑。编辑扩散技术是一种优秀的图像表象编辑方法,只需要用户提供稀疏的输入,就能方便地将用户的编辑期望传递给图像中相关的内容,从而有效的将用户从繁琐的编辑交互操作中解脱出来。但是,这类方法通常需要求解一个优化问题,非常耗时。目前最快的编辑扩散方法依然无法达到实时,难以满足用户即时编辑的需求。对此,我们提出了一种实时的编辑扩散的方法,加速后的算法可以达到实时,而且更适合用户所画线条数目较多的情形。新方法主要采用了两种优化策略实现。第一,我们提出了一种高效的采样的方法来对用户所画线条进行采样,从而极大减少了已有方法中存在的冗余采样;第二,我们采用了k-means聚类算法预先对图像进行聚类,并基于聚类进行优化问题的求解,从而极大的减少了优化计算的规模。实验表明,新方法与以往方法相比,速度提高了至少一个数量级,对于中等图像可以达到实时。   (2)泊松图像克隆技术因为其简单友好的交互方式而备受广大研究者和用户的欢迎,用户在使用这种技术选择感兴趣物体时,只需画出一条闭合边界将感兴趣物体圈起来即可,无需花费很大的精力来精确地提取出它的轮廓。这种技术会产生色彩渗透现象,它有利于边界的无缝融合,但是也会出现污染前景物体的问题。对此,我们将编辑扩散的思想引入到泊松图像克隆,提出了一种自由可控的图像克隆技术,从而可以让用户对色彩渗透现象实施自如的控制,以保留有利的而摒弃负面的色彩渗透现象。实验表明,自由可控的泊松图像克隆方法不仅能让用户对色彩渗透现象实施自由控制,还能让用户对前景物体的色彩进行自由编辑。   (3)梯度域图像合成方法和Alpha matting都因为能进行边界无缝的图像合成而受到广大用户的欢迎。但是,只靠边界的无缝融合并不足以确保高质量的合成结果,比如说,合成块跟目标图像有结构冲突以及色调不匹配的时候,结果图像中都会出现不真实问题。对此,我们提出了一种意愿关注的图像合成方法,以有效地解决这些问题。这是因为我们观察到,结构冲突问题出现的地方都是用户选择的图像块中位于其感兴趣的目标(objects of interets)之外的区域,称为过包含区域(over-included region)。由于图像块的边界一般与感兴趣目标有较大的表象差异。我们由此可有效地估算图像块中感兴趣的目标,并将过包含区域排除在图像合成计算外,使得感兴趣的目标更高质量地融入目标图像中。同时,我们也能自适应地控制用户感兴趣目标的色调变化,使它们能够更好地匹配目标场景。实验表明,意愿关注的图像合成方法能够有效地处理图像合成中经常出现的结构冲突和色调不匹配的问题。
其他文献
复合式火灾探测报警控制系统将业已成熟的感温、感烟等探测技术有机地融为一体,是当今世界范围内火灾探测报警技术领域最受人瞩目的研究方向之一.该论文通过对复合式火灾探测
近年来汽车数量迅速增加,带给人们生活便利的同时,也带来了交通拥堵、环境污染等负面问题。VANET作为智能交通系统的重要组成部分,吸引了许多研究者的目光。由于VANET较高的节点
随着大规模Web应用和极限事务处理需求的不断增长,传统的关系型数据库越来越不能满足人们的需求。因为兼具内存数据库和NoSQL数据库的优点,内存数据网格(In-memory Data Grid)
随着无线互联网技术的发展和移动设备的普及,人们对位置的需求越来越强烈。GPS技术解决了室外定位的问题,却很难应用于室内环境。业界一直没有形成普适的定位方案,室内定位问题
新疆是一个多民族的聚居地,少数民族尤其是维吾尔族在新疆人口中占有很大的比例。在信息互相交融的今天,各民族之间的文化交流日益频繁,如何借助先进的信息技术完成机器翻译、跨
自计算机产生至今,用户界面的设计与开发在软件开发的生命周期中占有非常重要的地位,它的发展经历了批处理界面、命令行界面、图形用户界面(GUI)及自然用户界面(NUI)的过程。随
云存储作为云计算的一个重要领域,通过把存储作为服务提供给外界使用,使得用户不需要建立自己的数据中心,只需要向存储服务提供商申请存储服务,节约了昂贵的软硬件基础设施的投资
细分类问题是指对属于同一个基本类别的物体进行分类,例如区分不同类别的鸟。由于背景中很少包含可用于区分细致类别的特征,所以能否精确分割前景物体在细分类中至关重要。同时
该文针对701研究所现有的图纸资料人工管理模式与先进的CAD技术的不相适应,提出了工程图无纸档案系统的设想,并从现实情况和将来可能的技术进步出发,拴面地介绍了该系统的设
未来的深空网络可以在多个行星之间进行数据传输。其中最大的挑战是具有长链路传播延时、高链路误码率、不持续链路连接和不对称链路带宽特性的深空骨干网络。大传播延时和高