龙芯UNCACHE加速原理及其在系统图形性能优化中的应用

来源 :高技术通讯 | 被引量 : 0次 | 上传用户:kevendong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对当前采用独立显卡的桌面计算机系统架构普遍存在的CPU(中心处理单元)访问GPU(图形处理单元)存储空间数据传输延迟较大的瓶颈,采用了龙芯GS464处理器核心实现的UA(uncache acceleration)机制对GPU驱动程序中的GPU存储空间访问接口进行优化,极大地提高了处理器向GPU等IO存储空间连续数据写入的速度。详细分析了龙芯处理器uA机制的原理及其相对于uncache方式IO写所能带来的性能提升。通过UA机制优化了龙芯3A+2H平台的GPU驱动性能,x11perf测试结果显示,采用UA优
其他文献
一、学校无形资产的内涵与作用 学校除了具有有形资产外,同样有自己的无形资产。这种无形资产可以体现在校名、专业名、校级别、校风、传统精神、教改成果,毕业生形象、名师
中国合众蚕桑改良会是民国时期改良中国蚕业的一个重要机构,它兴办制种场、创设指导所、设立蚕业学校、培养技术人才,对促进民国时期的蚕业改良乃至对建国后蚕桑业的发展,都
研究一种3-RRRT新型高速并联机器人的运动学及动力学建模及分析方法。采用D-H法建立了各构件体坐标系,以此为基础,建立了3-RRRT并联机器人运动学模型,并给出了其位置解析解;基于
分析了现有云制造环境下云企业资源优化配置方法的局限性,充分考虑了云制造环境下资源的关联性、相似性及先验性特点,从云企业运营费用的角度提出了一种新的云企业资源优化配置方法。该方法首先定义资源优化配置问题的决策变量,建立资源优化配置问题模型,然后建立资源的关联性、相似性及先验性的相应模型并将其应用到目标函数中,最后采用基于实数矩阵编码的遗传算法进行问题的求解。由于采用了适合实数矩阵编码的交叉变异规则和
踏着回乡的征途,想着梦寐已久的家乡,火车在飞速地奔驰,心情却变得越来越激动…… “连云港站到了……”“啊!”我不由得大叫一声:“好高兴哟,我终于到家了!”出了站,我和老
根据文献记载,秦汉时期对合唱形式特别重视,从宫廷到民间合唱艺术的发展空前兴盛。宫廷以"千人唱,万人和"的大型合唱作为主流形式,民间则以"一人唱,三人和"的小型合唱为主,并作为
为使学生能在中专学习阶段,掌握一定计算机操作及辅助设计技能,我校在1987年进行机制专业教学改革之始,就把加强计算机教学作为教学改革的重要内容之一,经过十年的不断努力与
文章从第三方物流的概念和特点入手,分析了我国第三方物流企业的发展现状以及在发展过程中出现的种种问题,并从宏观政策方面为第三方物流业的发展提出了一些建议。
应用粉体喷射搅拌技术处理软土地基,效果显著.文章以天津东环立交桥和天津保税区软土地基加固工程二例,对粉体喷射搅拌技术的原理、特点及施工工艺、质量检验等进行介绍.
检察机关量刑建议权,又被称为求刑权,是指检察机关在审判活动中就被告人所应判处的刑罚向人民法院进行建议的一种行为和职权。近几年来,随着我国司法改革的推进,检察机关的量