论文部分内容阅读
随着视频编解码技术的不断发展,高清视频应用的日益普及,人们对视频的清晰度和流畅度的需求也变得越来越高。高清晰度视频编码解码处理是数据密集和计算密集的计算,计算机系统中通常采用专用的硬件单元加速视频编解码处理。本文结合PKUnity-3(65)系统芯片的研制,通过在芯片中集成一款专用的视频处理器(VPU)单元,加速视频编解码计算,在不增加CPU计算负载的情况下,实现对高清晰视频编解码的实时处理。 首先,在PKUnity-3(65)系统芯片中集成了视频处理器,并采取分层验证的思想,分别在独立模块环境,SoC模拟环境和FPGA环境中,验证了系统芯片中集成VPU的功能正确性。针对存储器单元替换验证设计采取覆盖率检测的方法,确保了ASIC存储器替换的正确性。在FPGA验证环境中,设计采用应用程序对VPU的不同标准编码和解码功能、多路复用功能和视频翻转旋转后处理功能等进行覆盖性的验证。 其次,为验证系统芯片中集成VPU的性能指标,设计并搭建了VIP性能评测环境,对视频处理器的各项工作性能进行了评测分析。在VIP环境中,通过监测每帧数据的处理时间和访存交易量来评估VPU的工作性能。VIP环境评测结果表明,高清视频解码的最低工作频率要求是:核心工作频率166MHz,AXI总线频率200MHz,DDR频率200MHz。应用环境评测表明,在AXI总线带宽足够的情况下,VPU的核心工作频率是影响系统芯片视频编解码性能的主要因素。 最后,分别在系统平台层和应用层分别讨论视频处理器的优化方法。在系统平台层采取的优化方案包括:根据需求降低频率来达到既满足功能又降低动态功耗的目的;通过VPU的第二条AXI总线访问SRAM工作模式的L2Cache来减少访存交易。测试数据表明,双总线方案可以提升8.49%视频解码性能、9.34%视频编码性能和11.06%的两路复用编解码性能。应用层的性能优化工作主要针对多路复用功能的使用以及视频通讯软件的设计。