数字音视频码流的分割及合并技术研究

来源 :上海交通大学 | 被引量 : 0次 | 上传用户:lsy0718
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着数字音视频压缩技术的发展及各类多媒体业务的升级,音视频码流的分割/合并技术的应用也将逐渐广泛。本文主要从素材编辑、集群转码两类应用环境入手,分别对音视频码流的分割/合并技术进行研究。素材编辑环境下的音视频分割/合并侧重于针对具有完整组织结构的音视频素材实现非线性编辑“剪”和“接”的操作。本文针对现今高清非编制作的主流格式P2系列音视频素材,先后讨论了高码率MXF格式及低码率MP4格式素材的分割、合并技术实现。对于采用帧内压缩方式的DV、AVCI两类高码率MXF素材文件而言,难点在于对原素材元数据的解析、保留以及对较大素材文件实现的高效性,文中详细介绍了对此类文件元数据解析、音视频数据定位的流程,提出了多线程的重写方案,实验并确定了合适的重写数据块大小,有效缩短任务耗时;对于采用了帧间压缩方式的低码率MP4文件,文中具体针对低延时模式及含有双向预测帧的情况提出了基于帧变换的分割方案,达到了帧精度,与全解/分割/再次编码的传统方案相比有以下优点:由于仅在分割点附近的相应帧做帧类型变换,不需做全范围的解码编码,有效缩短了任务时间;避免了由全解/分割/再次编码方案造成视频图像降质的不足。集群环境下的音视频分割/合并侧重于提出多粒度的分割方案以及平滑的子片段合并算法及方案,使集群转码系统能够有效的整合计算资源,完成转码任务。本文结合集群转码系统业务流程的特点,分析了由转码管理服务器端对音视频做物理分割方案的不足,提出了基于打点的准分割方案,并针对常用的MPEG-2传送流格式具体讨论了如何对素材进行解复用打点以及任务拆分,确定了基于GOP的分割策略。随后着重讨论了如何对素材片段进行合并复用,保证音视频的重同步。最后在含有7个计算节点的集群转码系统环境下着重就分割粒度对转码性能的影响进行了实验,提出了合适的素材分割粒度。
其他文献
随着城市道路愈发拥堵、交通事故频发,人们对智能交通、智慧城市的诉求也愈加强烈,本论文在这个大背景下,对车与车之间(Vehicle-to-Vehicle,V2V)的互联通信问题进行研究。当
当今社会,通信在人们生活中的地位和作用越来越重要,通信已经成为社会发展的重要战略手段。随着移动通信网络规模的不断扩大,网规网优成为人们越来越重视的研究课题。集群通
在当代,随着科技的发展,移动智能设备的普及,万物联网的方便,信息量的几何级增长,大数据浪潮已然来临。众多海量数据中,文本数据占据了很大一部分。面对日益增长的文本数据,
本文主要研究适宜于高动态信道条件的无线SISO-OFDM及MIMO-OFDM接收机采样钟同步的关键技术及其实现方案。论文首先简要介绍了无线移动通信系统的发展和现状,阐述了OFDM技术
移动机器人的研究不仅在空间探索、军事、民用等领域都有着广阔的应用前景,而且还为人工智能、数据融合、信息处理等多种学科提供了很好的发展平台。基于计算机视觉的自主导
目前在占投资比重较大的装饰装修工程中,工程造价缺乏全面的、系统的、全过程的控制和管理,使建筑装饰装修工程管理和造价计量存在许多问题.本文以此为背景对建筑装饰装修工
全球导航卫星系统(Global Navigation Satellite System,GNSS)通过全天候、不间断地播发导航信号,可实现对目标的实时定位、导航和监督管理。GNSS已深入应用于生产生活等多个
随着智能手机、互联网金融的发展,以及家庭智能安防机器人的普及,人脸识别在身份认证,犯罪监控等方面的应用日益广泛。目前的正面人脸图像的识别也达到了较高的水准,但是由于
近年来,第四代移动通信技术(4G)越来越受到人们广泛的关注。下一代移动通信能提供更大的覆盖范围、更高的可靠性、更高的传输速率和频谱利用率。多输入多输出(MIMO)系统可以
智能视频监控是近几年来机器视觉研究的重点领域,而这一领域的研究核心是基于视频的运动目标检测、跟踪和后续的行为识别。它融合了模式识别、图像处理、人工智能、自动控制