针对视频编解码场景的图像语义分割算法的研究及实现

来源 :中国科学院大学(中国科学院大学人工智能学院) | 被引量 : 0次 | 上传用户:wingkong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
目前,视频编解码在视频图像领域被广泛应用,同时在对视频图像进行编解码处理时需要庞大的算力支撑。因此,算力成为视频编解码效率的重要影响因素。而在视频编解码过程中,由于外界环境的扰动,往往会对背景等不感兴趣的物体进行无用的编码,浪费大量的算力。国内外针对视频编解码效率的研究主要集中在生成编码块后,对帧内或帧间预测时对编码块进行的优化,并未涉及到编码块生成之前对视频图像的优化。针对这一现状,本文提出了一种针对视频编解码场景的图像语义分割算法。本文从一种新的优化角度出发,通过一种新的图像分割算法生成编码块,将背景等不感兴趣的部分提前分割出来,以避免在编码过程中对背景及其他不感兴趣的物体的无用重编码,来减少编解码过程所消耗的算力,提高编码效率。论文的主要工作包括:(1)提出一种新的图像分割算法。本算法通过将图像划分为n×n个编码块,实现以编码块为单位对图像进行分割。将对图像中每个像素点的分割转化为对图像中的每个编码块的分割。通过对图像中的背景及其他不感兴趣的物体提前分割出来,生成带标注的编码块,并通过对编码块的生成优化实现对视频编解码的优化。将编码块生成问题转化为对图像的分割处理问题。(2)基于卷积神经网络实现该图像分割算法。卷积神经网络具有强大的特征提取功能,利用卷积神经网络可以自动弥补传统算法中受限于先验知识的缺陷,提取出视频图像的特征,并根据图像特征生成编码块。(3)针对硬件特性对神经网络进行优化。针对硬件通道对齐的特性,对神经网络结构进行优化,加速神经网络在GPU下的训练过程以及加速在硬件MLU下的推理过程。通过以上三种优化,基于图像分割算法将视频图像中不感兴趣的部分分割出来并生成视频编解码所需的编码块,根据分割得到的带标签的编码块可以减少视频编解码中的无用编码。最后通过卷积神经网络及其优化,加速神经网络的训练和推理过程,实现对视频编解码技术的优化。
其他文献
精制棉用途广泛,为现代轻纺、医药、化工、军工等工业的重要原料之一。精制棉生产过程中会产生大量的蒸煮黑液与漂白废水,在工业应用中多通过物化-生化对其进行处理,处理后水中有机污染物大大降低,但直接排放对环境仍存在一定影响,且生产中水资源消耗大,严重制约了精制棉行业的发展。当前精制棉生产工艺成熟,生产时水耗量难以降低,如何将废水回收循环利用成为解决精制棉行业发展的关键所在。本文通过对经处理排放的精制棉废
自《企业破产法》出台以来,环境债权一直作为普通债权最后清偿,这一顺位一直未曾改变。随着社会经济的发展,高质量发展已成为时代主流,单纯的经济效益优先原则已不能适应时代需求。同时,以环境责任保险制度、环境责任基金制度为代表的救济制度在我国仍不完善,资金来源、适用范围、投保方式等都尚未明确。即使在环境保险制度非常完善的美国,尚面临资金不足的问题。在这样的情况下,有必要重新调整环境债权在破产清算中的清偿顺
抑制水中舰艇的振动及噪声辐射对提高艇上机械设备寿命、提升工作人员舒适度以及增强舰艇的声学隐身性能有着重要的意义。低频抑振器是一种新形式的低频抑振设备,对低频范围内结构的振动噪声有很好的抑制作用。为了分析低频抑振器对水下结构低频带振动噪声的抑制特性,本文基于有限元分析方法,建立了附连低频抑振器的水下平板结构声振仿真分析模型,先后对低频抑振器进行了减振降噪效果及机理分析、参数化分析、多个低频抑振器和低
弱磁探测在医学和军事等很多方面都具有重要的研究价值,先进的磁场测量方法和高性能磁场传感器一直是世界各国重点研究热点。基于电磁感应透明(EIT)的磁力仪主要是利用在EIT
间歇生产过程作为现代工业过程中必不可少的生产方式,由于其多品种、小批量和高附加值等特点而备受青睐,因此在现代工业生产中有着难以撼动的地位。随着同时代发展物质的极大丰富,人们对产品的要求日益提高,间歇过程的工艺和流程的复杂程度也在增加,其系统运行时的不确定性和外部干扰等因素已成为间歇过程发展道路上的阻碍,妥善处理此类问题以提升系统性能变得极为重要,因此现阶段研究有效的先进控制方法去处理不确定性等问题
近些年来资本市场企业间的并购活动增速逐渐放缓,但是仍然有较高活跃度,基于资产重组、行业整合等目的而实施的并购依旧频繁,并购也逐渐成为中国企业迅速发展壮大的途径之一。伴随着电子商务的兴起,我国快递行业迎来了黄金发展时期,但是飞速发展的背后却面临着国际化水平低等问题,在国内市场竞争日益加剧的背景下,快递行业将目光聚焦国际市场,意欲通过并购方式发展跨境业务,打通国际物流通道,享受国家政策红利。作为我国快
童声合唱是合唱的一个分支,童声所独具的纯净、优美、宛如天籁的特点,使其在众多的合唱类别中独具魅力。在义务教育阶段音乐课程的深化改革全面铺开的背景下,学校童声合唱团如雨后春笋一般不断涌现。灵活运用教学策略,是提高课堂效率卓尔有效的手段。本文正是基于这一目的,以泰州实验学校“小海豚合唱团”为研究对象,了解童声合唱的研究现状,结合对3~4年级学生的学情分析、总结与反思自身的教学经验,对一些教学方法进行了
山羊子宫内膜炎是产后常见的疾病之一,可造成山羊屡配不孕和淘汰率升高等问题,给山羊养殖业造成巨大经济损失。大肠杆菌(Escherichia coli,E.coli)是山羊产后子宫内膜炎的主要致病菌。皮质醇(Cortisol,Cor)属于糖皮质类激素,具有免疫抑制作用。本实验室体外试验已证实皮质醇可通过调节MAPK和NF-κB信号通路,抑制脂多糖诱导的奶牛子宫内膜上皮细胞的炎性反应,但这种机制很少在山
今天,图数据库由于其在现实生产生活场景中的建模优势、在关系查找方面的性能优势,成为越来越重要的基础软件。国内外许多软件厂商都推出了自己的图数据库产品。Stellar DB是星环公司的图数据库,可以与其他组件配合,实现图存储、图分析、图可视化等重要功能。Stellar DB存储引擎采用日志结构合并树(Log-Structured Merge-Tree,下称LSM树)数据结构作为底层数据存储方式。但是
先秦时期“名”与“礼”有密切的联系,孔子正名思想的产生,正是源于对“名”与“礼”之间关系的深刻认识。本论文从孔子正名思想的文化渊源、历史与现实背景、内容与实践等方面,分三章进行论述:第一章,“名”与周代礼乐制度。本章论述了“名”在周代礼制构建的过程中,向政治、伦理的渗透。周代礼乐制度的构建以“名”为核心,在周代礼乐制度构建的过程中,周人通过“名”划分了祭祀等级、政治尊卑及宗法亲疏的序列。礼乐不仅作