论文部分内容阅读
近年来伴随着2K、4K甚至8K高清视频的大量出现,针对高清视频内容的编码和传输显得更加重要,但是对于高分辨率的视频来说,传统的视频编码标准H.264/AVC的编码效率已经显得力不从心,因此为了提高编码效率,ITU-T的视频编码专家组VCEG和ISO/IEC的运动图像专家组MPEG联合成立了 JCT-VC组织,共同提出了最新一代的视频编码标准HEVC(High Efficiency Video Coding)。HEVC相比于H.264来说,改进的编码技术被应用于编码框架的各个模块当中,尤其是新的编码工具的提出使得HEVC的编码性能得到了很大的提升,但是在采用这些工具的同时,编码的时间复杂度也大大的增加,从而严重阻碍了 HEVC编码标准的推广和应用,所以本文针对HEVC的帧内编码优化和帧间编码优化进行研究,并利用符合HEVC编码标准的x265函数库进行多视点视频实时编码和传输的演示平台的搭建,本文的主要工作包括:(1)考虑到HEVC中基于率失真优化的编码单元四叉树递归划分算法存在着较大的时间复杂度,因此我们引入了一种利用特征数据进行离线训练的决策树预测模型,并将此预测模型运用在视频编码标准HEVC框架中,针对帧内编码单元(CU)的划分过程进行优化。决策树预测模型的引入有效的实现了帧内编码单元的快速划分;(2)在HEVC帧间编码的过程中,当前深度的编码单元需要遍历多种不同类型的预测单元(PU)模式,HEVC定义了 10种不同类型的PU划分模式,包含Skip/Merge模式、帧间2N×2N模式、帧间N×N模式、帧间N×2N模式、帧间2N×N模式等。我们依据实验统计的结果,利用F-Score选择算法进行特征的优化选择,将筛选的优化特征子集用于决策树预测模型的离线训练,从而提出一种依据决策树模型进行帧间预测模式的快速判决算法;(3)实现了多路视频实时编码和传输的演示平台的搭建。演示平台分为服务端和接收端两个部分,平台的界面基于MFC框架实现。服务端的核心主要依据FFmpeg编码视频方案,采用符合HEVC编码标准的x265函数库来进行视频的实时编码,采用实时流传输协议(RTP)和多线程编程技术将编码后的多路视频码流进行局域网传输;在接收端则依据FFmpeg解码视频方案,将接收到的网络数据包解码为视频数据之后,将其传递给视频显示线程并实时显示在屏幕的对应窗口。