论文部分内容阅读
伴随着数字信息化的发展,高清、超高清视频应用开始遍布社会的方方面面,视频的高清化和应用场景的多样化对视频编码压缩提出了更高的要求。为了满足人们对超高清视频的诉求,视频编码联合组(JCT-VC)制定了新一代视频编码标准——H.265/HEVC(High Efficiency Video Coding),与前代编码标准H.264/AVC相比,HEVC在同样的编码质量下能够节约50%的码率,为视频的高效压缩提供了有效解决方案。但是,HEVC提高编码性能的同时带来了更高的编码复杂度,例如基于四叉树的灵活块编码结构,率失真决策技术等,引入了较高的计算复杂度,这导致不能实现实时编码,影响HEVC在如视频会议、网络直播等高清视频服务方面的应用。因此,本文将HEVC帧内编码的优化作为研究课题,详细分析HEVC的特色编码技术和编码复杂度引入的原因,在分析当前编码优化算法的基础上,通过研究机器学习的优秀算法过程运用,提出了两种基于集成学习的HEVC帧内编码单元快速算法。针对帧内编码单元的划分优化,本文研究的主要内容及创新点如下:(1)针对HEVC帧内编码单元递归式划分引起的高复杂度问题,提出了基于决策树和支持向量机异质集成(DT and SVM ensemble,DT-SVM)的编码单元快速划分算法。将编码单元的划分建模为二分类问题,以纹理特征的统计量作为特征属性,用决策树和支持向量机进行简单高效预测当前编码单元是否划分,当且仅当预测结果不一致时,利用HEVC的率失真技术进行决策,一定程度上避免了不必要的率失真代价(Rate Distortion cost,RDCost)计算过程,降低了编码器的计算复杂度。为了探究编码单元纹理特征与划分之间的关系,选择用包裹法wrapper(评估方法WrapperSubsetEval+双向搜索策略Bidirectional Search)进行最佳特征子集的评估选择。(2)针对DT-SVM模型训练的缺点和HEVC帧内编码单元复杂度仍然比较高的问题,为了进一步提高HEVC编码速度和编码单元划分预测精度,提出了基于随机森林分类(Random Forest Classifier,RFC)的HEVC编码单元快速划分算法。随机森林算法采用过滤法filter(单一属性评估法GainRatioAttributeEval+排序搜索策略Ranker)选择最优属性特征,将其作为编码单元是否划分的判断依据,算法过程不再进行HEVC的RDCost计算。为了进一步提高分类器的预测精度,提出了基于网格搜索法对随机森林的参数进行优化选择。实验结果表明,基于性能优异随机森林的HEVC编码快速算法更有效地降低了编码复杂度。