访存优化相关论文
图像处理在遥感技术、医学领域、安全领域、工业生产领域具有广泛的应用,图像边缘检测算法是图像分割、目标识别、形状提取的图像......
国家十三五规划以来,数据中心迅速发展,其上承载的增值业务越来越多。一方面,数据中心越来越多采用基于NUMA虚拟化并行体系结构的......
图像分类识别已经成为了人工智能领域一个重要的组成部分,是人们当下研究的热点话题。卷积神经网络是图像分类识别中的一项关键技......
共享存储多核多级Cache结构已成为高性能计算领域通用的处理器架构。虽然多级Cache结构能够有效缓解“存储墙”,但在科学计算程序......
图处理系统作为一种大数据分析工具被用到很多领域中,在图规模不断增大的背景下,对处理系统的扩展能力与并行性提出越来越高的要求,一......
残差网络由于其优越的性能广泛应用于图像分类领域.但是作为典型的深层网络,其网络参数众多,对于资源受限的嵌入式设备网络推理速......
长期以来,处理器和主存的性能分别按照不同的速度增长,达到一定的程度时,处理器的快速增长对系统性能的提升逐渐被慢速发展的主存......
超越函数作为基础数学函数的重要组成,为众多领域的高性能应用开发提供支持,保证了高性能应用高效可靠的运行,因此其高效性问题不......
在时序天文学中,观测设备具有在时间轴上频繁采样的特点,这导致处理数据的海量性,应用传统科学计算方法生成时序数据通常耗时较长,......
数学库函数算法的特性致使函数存在大量的访存,而当前异构众核的从核结构采用共享主存的方式实现数据访问,从而严重影响了从核的访......
研究了双粒度目录(DGD)下片上多核处理器的访存行为以及DGD对不同共享行为的目录开销,以进一步降低DGD结构的面积开销。针对DGD需......
为了提高非一致内存访问(NUMA)架构虚拟机解释器的访存性能,研究了解释器在NUMA架构下的访存优化技术,提出了一种NUMA架构下的解释器访......
为提高Cache的有效容量,进行了Cache压缩研究,并提出了一种区域协作压缩(RCC)方法,以提升最后一级缓存的压缩率。与传统的Cache压缩......
随着微处理器架构的发展,将片上SRAM组织成SPM这种软件管理的非cache结构成为众多处理器的选择。SPM结构的特点是实现简单,访问延迟......
为了在GPU上实现允许k-差别近似串匹配并行算法,并进一步提高在GPU上的算法性能,在综合考虑GPU的存储层次前提下,采取了多种访存优......
以自主嵌入式处理器为平台,对Android系统性能进行分析。通过Oprofile工具采集Android系统下的访存热点函数,结合处理器架构特点,......
受功耗、面积的限制,高性能众核处理器倾向于将片上SRAM组织成SPM这种非Cache形式,与片外主存构成多级存储架构。这种存储架构需要......
高性能计算机平台的超越函数由于采用查表与多项式结合算法,性能深受“存储墙”问题的影响,函数绝大部分执行时间消耗集中于访存操......
随着无人机技术的快速发展,机载合成孔径雷达(SAR)以高分辨率、高机动性和低成本等特点成为多云雾山丘地区的主要遥感手段,但机载S......
虽然批归一化算法能有效加速深度卷积网络模型的收敛速度,但其数据依赖性复杂,训练时会导致严重的“存储墙”瓶颈。故对使用批归一......
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们......
针对目前大多数计算流体力学程序对系统的单核计算能力利用不足,提出一种针对计算流体力学程序的单核指令级优化方法。该方法首先......
传统的流水线设计是以转移指令为中心的,大量逻辑资源被用于提高处理器转移预测的能力,以保证向流水线发射和执行部件提供充足的指令......
图(graph)是一种以顶点和边构成的包含多种信息的复杂数据结构.图计算(graph processing)要求我们将现实条件中的关系属性抽象为图......
粗粒度可重构处理器结合了高性能和高灵活性的优点,已经成为当前的热点研发方向。随着应用越来越复杂,带宽的限制已经成为影响粗粒......
随着CPU和GPGPU在各种环境下得到应用,人们逐渐发现这两个处理器各自的独特优势。为了实现优势互补并支持更广泛的场景,由CPU和GPG......
存储器是计算机系统的重要组成部分,是决定计算机系统性能的关键设备之一。随着半导体技术的发展以及集成电路制造工艺的进步,“存储......
为提高DDR3控制器访存效率,设计了基于DDR3存储器预取访问数据长度的数据缓冲机制,将访存请求分为三种基本类型并分别排队处理,降......
重要军事、民用设施对战争胜负起着非常重要的作用。如何快速有效掌控战场环境和发现并打击上述设施目标显得尤为重要,因此目标识......
神威·太湖之光是我国首台自主设计研发并登顶TOP500排行榜的超级计算机系统,搭载了国产SW26010众核处理器。该处理器的架构与传统......