基于显著性检测的监控图像压缩应用研究

来源 :成都理工大学 | 被引量 : 0次 | 上传用户:aspbasicer
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
如今图像压缩模型在社交媒体、自动驾驶和医学影像等各种应用场景都有需求,将现有模型应用到侧重点不同的场景中会遇到各种困难,比如在道路监控场景中,现有的图像压缩模型存在模型运行效率低、重建图像视觉质量差以及图像压缩率不理想等问题。针对这些问题,本文对道路监控场景进行针对性地设计,得到一个基于显著性检测的监控图像压缩模型。首先针对重建图像视觉质量差的问题,设计一个改进的显著性检测模型。该模型主要由残差细化和边界感知两个模块组成,其中残差细化模块能提高精确度,边界感知模块能关注到更多的边缘细节信息,解决目标边缘模糊的问题。在进行图像压缩时,利用显著性检测模型为图像不同区域分配不同比特数,降低图像非显著性区域的比特数,优化图像显著性区域的视觉效果,最终解决重建图像视觉质量差的问题。其次针对图像压缩模型运行效率低和图像压缩率不理想的问题,设计一个改进的图像压缩模型。利用编码网络中的GDN(Generalized Divisive Normalization)模块生成更自然的图像块样本,从而提高重建图像质量;利用解码网络中的亚像素卷积模块最大限度地提高图像分辨率;利用CABAC(Context-based Adaptive Binary Arithmetic Coding)模块动态地修改概率模型,从而提高编码效率;利用Adam优化算法、GN(Group Normalization)正则化方法及混合损失函数调节参数,从而提高模型训练效率。最终解决图像压缩模型运行效率低和图像压缩率不理想的问题。然后针对图像压缩模型难以得到不同的图像压缩率的问题,提出一种多层次的残差编码方法。将每次迭代的数据输入到结构相同但权重不同的网络中,用前一次迭代的Conv LSTM(Convolutional Long Short Term Memory)模块隐状态初始化当前迭代的Conv LSTM模块隐状态。通过设置迭代次数得到不同的图像压缩率,最终解决图像压缩模型难以得到不同的图像压缩率的问题。最后在图像压缩模型的实际应用中,利用QT设计并制作一个监控图像压缩软件,设置相关参数,运行软件得到重建图像和相关评价指标,验证本文设计的监控图像压缩软件的可行性。
其他文献
互联网发展到今天,已经走过了野蛮生长的阶段。无论是用户还是内容生产者,都在潜移默化中转变着自己在这个数字时代中的身份。媒介环境因为短视频平台的兴起发生着肉眼可见的变化,公共舆论场也随着用户的大量涌入逐渐在短视频平台落地生根。由于其自身的特点,短视频平台上充斥着大量具有娱乐性、低俗化、难辨真伪特点的视频内容。海量的信息洪流令人眼花缭乱,筛选和净化机制的缺乏令公共议题的讨论空间受到挤压,不得不让位于娱
学位
图像自动描述是一种跨模态转换的技术,它可以建立图像和文本之间的桥梁,让机器具有理解能力,对一张图片的内容进行详细地描述。人工智能技术的研究核心是如何让机器像人一样进行思考和决策,而让其具备“理解力”则是第一步。纵观整个图像自动描述技术的发展史,研究人员的研究重心都是围绕如何生成准确、连贯且贴合图片内容的句子而展开的,而关于图像描述技术的实际应用研究却很少。究其主要原因是这些模型都过度依赖于imag
学位
随着经济社会的发展和物质生活水平的不断提高,健康问题逐渐成为全社会关注的重点,人们对健康服务的需求越来越旺盛,越来越多的健康服务产业应运而生。在“互联网+医疗健康”背景下,中国移动健康产业蓬勃兴起,移动医疗APP如雨后春笋。目前,移动医疗APP还存在着产品功能同质化严重、平台难以保障受众隐私、法律法规尚未健全、监管体系亟待完善等问题。为了提升受众体验,提高产品服务质量,激发受众需求,推动移动医疗A
学位
近年来,随着移动通信技术的发展,短视频已成为人们信息传播的重要手段,自媒体短视频以其丰富的视听表达,开始在跨文化传播中发挥重要作用,成为社交媒体时代建构国家形象的重要力量。本文正是在这样的背景下,提出了本文的研究对象:“李子柒”短视频的海外传播,有着“东方美食生活家”之称的李子柒,以中国传统的饮食文化为切入点,围绕传统田园生活的衣食住行推进,以短视频的方式展现了古色古香的美食和返璞归真的田园生活,
学位
近三十年来,我国的高速公路建设获得了飞速发展。随着公路运营时间越来越长,重载、雨水、温度等外部因素会导致裂缝、坑槽、沉陷等表面病害和不密实、层间脱空、松散等隐伏病害发生。目前,我国高速公路已从“建设为主”逐渐转变为“建养为主、养护为主”。为了提高公路养护决策能力,保证交通安全,对公路病害,特别是隐伏病害的高效、高精度检测成为了当前亟待解决的关键问题。隐伏病害检测方法主要分为钻芯取样和无损检测两大类
学位
近年来,突发公共卫生事件频发,对人们的身体健康与生命安全产生极大的危害。疫情的有效防控成为各国关注的焦点。科普短视频的兴起,为健康传播提供了新的传播手段。作为一种新兴的传播媒介,科普短视频具有将大众传播和人际传播相结合的优势,其时效性和传播广度也达到历史峰值,为突发公共卫生事件背景下的健康传播提供了新的机遇。因此,发挥其在突发公共卫生事件背景下的社会影响研究极具理论和现实意义。2019年12月8日
学位
学位
近些年,雪灾、洪灾、泥石流和地震灾害时常在我国发生,这些自然灾害对我国人民生命和财产安全造成了巨大的损失。受灾地区的通信基础设施往往在灾害中被大规模损坏,灾区的通信长时间处于中断状态。因此,在灾害发生后为通信中断的受灾区域提供通信保障具有十分重要的意义。目前,常见的应急通信方式有应急通信车、卫星通信、固定翼无人机通信和系留多旋翼无人机通信等。但它们都存在各自的缺点:1,应急通信车天线高度较低,信号
学位
随着无人机的功能和性能需求的不断提升,为确保无人机各项功能的完备、工作状态的安全稳定,则需要对无人机高速飞行时的关键数据进行采集和存储,飞行结束后再对存储数据进行回放及分析。因此研制出小型化、低功耗的机载信号采集存储设备具有重要的现实意义。本文根据课题相关技术指标和实际应用场景,设计一种以FPGA+ARM为处理核心的机载信号采集存储系统。主要研究内容如下:首先研究数字下变频的整体结构。在数控振荡器
学位
随着计算机算力的不断提高,情感计算的相关研究也取得了重大突破,情绪识别作为该领域的重要分支,受到众多国内外研究者的关注。鉴于单模态情绪识别存在准确率较低的缺点,研究者提出用多模态的思想来研究情绪识别。通过采用更加全面而丰富的多模态信息,结合多种维度的特征,借助深度学习中的神经网络分析信息中的关联性和互补性,从而显著地提高了模型的准确率,增强了模型的鲁棒性。本文基于深度学习思想,主要提出了针对文本模
学位