多格式高清音视频解码软件的实现与优化

来源 :北京大学 | 被引量 : 0次 | 上传用户:yushilv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机芯片技术和通信技术的发展,音视频处理成为计算机典型的应用,而音视频的处理能力,成为评估计算机系统性能的重要指标之一。由于高清音视频的解码涉及复杂的处理算法,具有处理数据量大,计算复杂度高的特点,高清晰度和多种格式的音视频解码需求,给计算机系统的设计和优化提出了新的挑战。本文着重于结合PKUnity-3(65)计算机系统芯片的硬件结构设计,研究支持多格式高清音视频软件解码的实现和优化方法。   首先,本文在PKUnity-3(65)软硬件平台上,基于Mplayer开源软件解码框架,实现了一款高清音视频播放器,支持多格式音视频解码、字幕解码和显示控制等功能;通过软硬件协同处理,采用PKUnity-3(65)芯片中集成的视频解码模块加速视频解码,设计并实现了统一的视频加速应用程序接口,提高了软件的可移植性。实验结果表明,与纯软件解码相比,采用视频解码模块的软硬件协同处理方法可以提升25~40倍的视频解码性能,在CPU工作频率为1GHz时,计算负载小于8%。   其次,针对DTS音频解码软件,本文着重分析了DTS音频的编码算法,特别是ADPCM及多相滤波操作,采取将IDCT-IV操作通过快速DCT变换来实现,有效降低了算法的复杂度,同时将加窗操作改为原地执行,有效降低了数据拷贝的次数。评测结果表明,DTS音频软件解码的性能平均提高1.5倍以上,在CPU工作频率为1GHz时,计算负载小于25%。   最后,本文对高清音视频解码软件进行了性能评测,评测结果表明,在CPU工作频率为1GHz,DDR频率为266MHz,视频解码模块频率为125MHz时,可实现1080P高清视频和DTS音频的实时解码和播放;在CPU工作频率为1GHz,DDR频率为667MHz,视频解码模块频率为333MHz情况下,1080P多格式高清视频解码帧率可以达到55帧每秒以上。
其他文献
语音对话是人们进行交流的最普遍的方式。当前对对话语音进行分析的需求越来越大,因此,限定领域对话的语音识别研究的重要性也越来越大。   限定领域对话语音识别在实用化
科研管理是科研活动的重要组成部分,其信息化水平直接影响着科研管理的效率、能力和科研工作者的积极性、创造性以及研究机构的整体竞争力。因此,建立一套以决策支持系统为核心
随着网络的普及和深入应用,当今万维网(Web)汇聚了极其丰富的信息资源,在这种信息爆炸的网络环境下,人们不再满足于门户网站、搜索引擎这种主动信息获取方式,更期望通过内容监测,
访存性能一直是现代处理器中的性能瓶颈。访存部件(Load Store Unit,LSU)是超标量处理器中专门用于处理与访存相关一类指令执行的功能部件。由于访存指令的执行效率直接影响
手语作为一种多模式协同的视觉语言,是听力障碍者在工作与生活中与他人交流的主要手段。中国手语词的数量远少于标准汉语,大量的信息都蕴含在丰富的视觉韵律中。已有的中国手
DSLAM是数字用户线路接入复用器,其功能是接纳所有的DSL线路,汇聚流量,相当于一个二层交换机,用作宽带接入。基于网络协议的DSLAM测试技术,要求测试人员手动的操作各种设备来
随着电子信息规模的扩大,海量存储系统中,元数据服务器的性能、可扩展性和可靠性面临了很大的挑战。本文结合中科院高能物理研究所的海量存储系统GRASS,完成了以下研究:  
随着XML成为事实上的数据交换和数据共享的标准,XML技术也在信息技术环境中扮演着至关重要的角色,针对大量XML数据高性能处理的要求也越来越迫切。Xquery语言是W3C提出的一种
SaaS(software as a service)是随着互联网技术的发展和应用软件的成熟兴起的一种创新的软件应用模式。相对于传统web软件系统,SaaS系统由于其应用领域、实现方式等方面的不
计算机技术和网络技术的快速发展促进了工业控制系统的智能化进程,以现场总线系统和工业以太网为代表的网络控制系统实现了底层现场设备之间以及生产现场与外界之间的信息交换