一种视频处理器的集成验证与性能优化

来源 :北京大学 | 被引量 : 0次 | 上传用户:Andy_nnu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着视频编解码技术的不断发展,高清视频应用的日益普及,人们对视频的清晰度和流畅度的需求也变得越来越高。高清晰度视频编码解码处理是数据密集和计算密集的计算,计算机系统中通常采用专用的硬件单元加速视频编解码处理。本文结合PKUnity-3(65)系统芯片的研制,通过在芯片中集成一款专用的视频处理器(VPU)单元,加速视频编解码计算,在不增加CPU计算负载的情况下,实现对高清晰视频编解码的实时处理。  首先,在PKUnity-3(65)系统芯片中集成了视频处理器,并采取分层验证的思想,分别在独立模块环境,SoC模拟环境和FPGA环境中,验证了系统芯片中集成VPU的功能正确性。针对存储器单元替换验证设计采取覆盖率检测的方法,确保了ASIC存储器替换的正确性。在FPGA验证环境中,设计采用应用程序对VPU的不同标准编码和解码功能、多路复用功能和视频翻转旋转后处理功能等进行覆盖性的验证。  其次,为验证系统芯片中集成VPU的性能指标,设计并搭建了VIP性能评测环境,对视频处理器的各项工作性能进行了评测分析。在VIP环境中,通过监测每帧数据的处理时间和访存交易量来评估VPU的工作性能。VIP环境评测结果表明,高清视频解码的最低工作频率要求是:核心工作频率166MHz,AXI总线频率200MHz,DDR频率200MHz。应用环境评测表明,在AXI总线带宽足够的情况下,VPU的核心工作频率是影响系统芯片视频编解码性能的主要因素。  最后,分别在系统平台层和应用层分别讨论视频处理器的优化方法。在系统平台层采取的优化方案包括:根据需求降低频率来达到既满足功能又降低动态功耗的目的;通过VPU的第二条AXI总线访问SRAM工作模式的L2Cache来减少访存交易。测试数据表明,双总线方案可以提升8.49%视频解码性能、9.34%视频编码性能和11.06%的两路复用编解码性能。应用层的性能优化工作主要针对多路复用功能的使用以及视频通讯软件的设计。
其他文献
学位
随着信息与网络技术的快速发展,大数据已经影响到每一个行业。大数据的价值在于从各种类型的数据中快速获取有用的信息,而数据预处理是整个大数据处理周期中至关重要的环节,高质
Web服务是一种新兴的Web应用方式,是一个崭新的分布式对象模型,近年来得到了迅速的发展。随着其应用范围以及Web服务动态组合需求的扩大,Web服务的发布与发现,已经成为Web服务系
随着计算机技术、互联网络和移动网络技术的快速发展,信息的存储容量和传送能力不断提高,电子商务、普适计算、社交网络、物联网、云计算等各种形式的网络应用不断出现并得到快
最优化问题是工程实践和科学研究中普遍存在的问题,其中多目标优化问题是指那些需要同时优化多个目标的问题。一般来说,这多个目标是相互冲突的,因此,和单目标优化不同,多目标优化
模型检测是自动化地验证系统行为满足给定性质的一种技术。它的基本做法是通过对系统所有可能的行为进行探索来证明系统满足给定的性质。模型检测面临“状态爆炸”问题,即系统
随着社交媒体的快速发展,基于用户的情感分析逐渐引起了研究领域的关注。情感分析指的是根据用户在社交媒体上评论自动地分析出用户情感极性。然而,用户仅仅在他们比较关心或者
全球随时随地都在产生着各种各样的数据,例如股票市场的交易数据、电子商务的订单数据、科学卫星的探测数据等等。这些数据都不是固定在某个地点,而是根据所属的应用种类通过计
语义蕴涵关系识别在自然语言处理中有广泛的应用。在多文档自动文摘中可以用来进行文摘句的选择,解决句子冗余;在机器翻译中,可以判断目标翻译句子与双语语料库中句子的语义蕴涵
人们在生活水平不断提高的同时,对生活质量的要求也越来越高,再加上信息的网络化和个人电脑的普及化,使得艺术品网上交易平台近年来发展势头迅猛。  本文以艺术品网上交易为背