内容敏感的视频缩放与稳定技术研究

被引量 : 2次 | 上传用户:leolee19820604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文的主要研究内容包括以下四个方面的内容:1)视觉显著性图检测;2)视频稳定技术;3)内容敏感的视频缩放技术;4)并行纹理合成。本文的第二至五章分别对应于作者在四个方面的研究内容。本文第二章对应于作者在视频显著性检测方面所做的研究工作。图像处理与模式识别技术一样,依赖于高质量的视觉显著性图(Saliency Map)才能得到较好的处理结果。现有的视觉显著性检测技术通常只能检测得到粗糙的视觉显著性图;这些粗糙的视觉显著性图应用于图像处理中将严重影响图像处理的最终结果。本文提出了一种随机的上下文相关的视觉显著性区域检测算法;该算法整合多层次粗糙的视觉显著性图到结果显著性图中,并逐步自适应地精化可信度不高的显著性值,最终得到一个考虑了多尺度特征的精细的视觉显著性结果。因为随机算法具有执行效率高,占用内存少等特点;本文的高效随机视觉显著性检测算法不需要建立额外的辅助数据结构来加速算法,只需占用少量内存就能快速检测出精细的高质量视觉显著性结果。并且高效随机的视觉显著性检测算法可以直接移植到GPU上并行执行;大量的实验结果表明本文的算法可以得到更加精细的显著性结果,这些精细的显著性结果应用于基于内容的图像缩放中得到了较好的处理结果。本文第三章提出了一种二维三维混合的视频稳定算法;该算法通过计算得到高质量的摄像相机运动,在保持每一帧的全帧一致性的同时,使每一帧的局部区域进行一种相似性变换,通过这种局部区域的相似性变换,得到一个稳定的,近似于三维投影映射的结果视频帧,达到稳定抖动视频的效果;并且本文方法还考虑了前后帧之间运动信息的相关性,通过运动信息的相关性约束视频帧,保持视频帧的时空一致性,最终得到高质量的视频稳定效果。以前的三维视频稳定算法往往只关注相机的运动,考虑通过加权平均相机位置的方法得到平滑的相机运动轨迹或者仅仅只考虑了很弱的全帧空间约束。然而弱的全帧空间约束不能保证全帧的一致性,可能导致视频帧扭曲严重。本文在通过平滑相机轨迹稳定视频的同时,显式采用能够强烈约束视频帧的局部运动信息,获得了高质量的视频稳定效果。作者用该算法在各类视频上进行了大量实验,并且和前人成熟的视频稳定算法作了比较。本文第四章介绍了一种面向抖动视频的视频缩放技术。将手持摄像相机设备拍摄的视频传输到小屏幕的移动设备上有非常重大的实用意义。这将涉及两方面的问题:稳定拍摄的抖动视频和缩放视频到适合目标设备分辩率的尺寸。在本文中,我们提出了个整合视频缩放与视频稳定功能到一个流水线的框架。此框架的中心组件是利用最小二乘法优化输入视频到输出视频的映射变换,同时获得高质量的相机运动。基于内容的视频缩放问题可以根据运动信息将扭曲分散到空间和时间维上来解决,而视频稳定问题则可以通过平滑相机运动和二维投影映射来解决。我们在各种类型的视频上,与之前的优化的方法做了大量比较,结果表明,本文方法既可以得到较好的视频稳定效果,也可以得到很好的视频缩放效果。本文的第五章阐述了一种并行的大规模纹理合成算法。传统的纹理合成方法使用高维向量树来加速目标纹理块的搜索效率,存在占用内存量大、执行效率低、无法在GPU上并行执行等缺点。为了实现图像块的快速近似邻域查找,提出一种并行优化纹理合成方法。该方法分为初始化和迭代优化2个阶段,初始化阶段从样本纹理中随机抽取样本纹理块填充目标图像,迭代阶段交替采用并行的随机查找算法和并行的纹理块传播算法迭代精化目标纹理。随机查找算法根据最相似纹理块出现在前一目标纹理块周围的概率与它到前一目标纹理块的距离成反比的特点,使随机采样纹理块的概率分布与最相似目标纹理块出现的概率相匹配,达到加速纹理合成的目标。用CUDA实现了文中算法,实验结果表明,该算法的执行效率比成熟的纹理合成算法快50-100倍,可应用于交互式纹理合成和超大尺寸纹理合成。
其他文献
目的探讨实时三维超声心动图(RT-3DE)评价心肌梗死患者左室收缩功能的准确性。方法选择临床已确诊的心肌梗死患者25例,分别利用二维超声心动图Simpson’s法、RT-3DE全容积法
拨开提单为证权证券的迷雾,将提单所表征的"提货权"与运输合同下的"运送物之交付请求权"相区分,还提单为设权证券之本原,不仅能解决长期以来困扰海事审判实践的"提单诉权"及
银质导电油墨和碳质导电油墨在电子网版印刷领域的应用越来越广泛。介绍了银质、碳质导电油墨在加热元件、SMD元件、厚膜IC、太阳能电池等方面的应用,论述了这两种导电油墨的
简要介绍了以基因工程为核心内容,包括细胞工程、酶工程和发酵工程的现代生物技术在改造食品资源、改进食品加工工艺,改善食品质量及开发新型保健食品等方面的应用状况,并展
混沌是由非线性系统产生的一种确定性的、貌似随机的过程,混沌序列具有非周期性、无规则性、有界性且不收敛,对序列的初始值极为敏感,复杂度相对于传统的伪码较高,这些特有的性质
随着社会主义新农村建设的不断深入,农村新建建筑日益增多。但是由于缺乏规划与管理,其中也包括对农村住宅室内热环境的重视程度不够,农村住宅维护结构的热工性能较差,而对维护结
国际环境责任法律问题初探●李伟芳国际环境责任有广义和狭义之分,用英文表示即“Responsibility”和“Liability”,中文的对应词都是“责任”。前者包含并侧重于一系列法律义务和职责,责任产生的前提是
本文通过金相显微镜以及煅烧法对不同工艺T700/YPH-41T(12k)体系碳纤维复合材料的纤维体积含量测定以及采用落锤冲击试验机对冲击性能表征。实验结果表明板材采用热压罐工艺
中西方财务管理差异之比较张文忠[关键词]中国,西方,企业财务管理,差异1.中西方财务管理理论研究方法上的差别从西方财务管理理论的发展过程看,一般是直接根据经营管理的现实需要从事
技术转移机构是一类促进技术成果从大学向企业转化的中介组织,是加速科技与产业融合的助推器。国内外许多学者对技术转移机构的功能定位、运作机制、运作绩效和政策环境等方面