嵌入式GPU硬件加速渲染的纹理传输优化及预取策略研究

被引量 : 0次 | 上传用户:tdkfire
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
嵌入式3D图形渲染技术已经应用到了很多场合,比如娱乐、医学、移动设备,航空航天等等。VxWorks嵌入式实时系统应用非常广泛,在此系统中,WindML组件提供了二维图形开发API,有研究人员在此基础上设计并实现了3D软件加速组件,取得了一定成果,但是其CPU占用率太高。随着嵌入式图形芯片的功能越来越强大,移植通用计算机上的3D硬件加速渲染技术到嵌入式系统领域成为了一种趋势。本文主要研究在VxWorks系统中开发3D硬件加速的底层驱动。其中,详细介绍了纹理传输过程,为了既提高图形渲染效率又不妨碍多任务正常运行,提出了两个方面的优化方法。完成的主要工作有如下几个方面:首先,提出了纹理传输优化方法。研究了GPU的体系结构和OpenGL图形驱动的工作原理。然后以纹理传输为切入点,详细阐述了地址空间映射过程以及主机与图形适配器之间的交互模型。原有交互机制基于等待队列,由于该机制依赖于系统时钟周期,延时较大并且存在不确定性,导致了传输速率抖动。因此本文提出可以采用两种优化方法进行交互。在提交DMA传输命令后,第一种是按照传输粒度大小等待固定延时后进行忙等待,第二种是等待固定延时后在辅助时钟的协助下等待传输结束的信号。测试结果表明,两种方法克服了抖动问题,在传输粒度较小时传输速率得到明显提升。其次,在多任务并行环境下测试了图形渲染任务运行情况,发现在纹理传输期间I/O密集型任务的运行受到限制,因此提出对I/O密集型任务的数据集进行预取来提高CPU利用率。预取算法借鉴Linux系统的read_around预取算法。最后,通过实验验证纹理传输优化方法和预取方法的有效性。一方面测试不同传输粒度下最大传输速率的延时长短,从而得到最合适的延时时间。通过实验表明选择合适的延时时间可以提高传输速率。另一方面采用了嵌入式性能基准程序Mibench,分别对I/O密集型和CPU密集型的多个任务进行了测试。测试结果表明,对I/O密集型的数据集进行预取明显提高了CPU利用率。
其他文献
目前,在轨道车辆制动方面,针对现场和教学的试验台,诸如JZ-7型、DK-1型试验台,只是单纯的进行机车车辆制动机系统的性能综合试验及单阀性能试验,侧重于制动机检修性试验,没有
罗伯特·潘·沃伦的诗歌为他赢得了包括两次普利策诗歌奖、美国国家图书奖在内的众多奖项和美国第一任桂冠诗人称号,吸引了国外众多研究者的目光,但国内对这位现代诗人的了解
随着我国经济的高速发展,铁路运输面临巨大的压力,为了提高铁路运输能力,大力发展高速铁路和开发铁路的运输潜能,在既有线铁路系统进行货运、客运及动车组混跑是目前铁路主要
晶须具有极佳的物理以及力学性能,使其作为补强增韧剂被广泛地用于制备各种先进的新型复合型材料。其中碳酸镁晶须作为新型材料,有着其他晶须无法比拟的性能。它的用途比较广
1964年至1975年间进行的越战是美国历史上最重要的一次海外干涉活动。参战的美国士兵发现,在战场上除了残酷的杀戮几乎没有正义或荣耀可言。美国为这场战争付出了沉重的代价
目的探讨过氧化物酶3(peroxiredoxin 3,PRDX3)在肝癌高风险人群(不同类型HBV感染)患者血清中的表达水平及临床意义。方法采用酶联免疫吸附法(ELISA)对慢性乙型肝炎、乙肝后肝
《全日制义务教育普通高级中学英语课程标准》(2001)、《义务教育英语课程标准(2011年版)》先后提出,教师应积极利用音像资源、多媒体资源及网络资源等现代教学资源的要求,以期丰富
<正>波利亚曾经说过:"解题的成功,要靠正确的转化"。教材提供的定理是我们解题的依据,然而,如果能将一些重要的基本图形进行深入研究并归纳其性质,往往在解题过程中可以起到
期刊
近年来,随着我国经济持续高速发展,城市建设得以快速的发展,城市规模不断扩大,城市人口日益增加,城市面貌日新月异,特别是城市基础设施的建设,使得城市道路更加宽阔,城市广场
<正>HN公司是一家护肤品牌全网代理商,在传统渠道、PC端网络销售深耕多年,积累了丰富的化妆品运作经验。当然,面对众多国际国外大牌线下线上的激烈竞争,公司的发展也遇到了一