数据预取相关论文
数据预取通过提前将数据放置在片上缓存中,减少片上缓存数据访问未命中,从而减少处理器的等待时间。现有的片上缓存数据预取技术通......
高速缓存数据预取是一项可以缓解日益增长的处理器和主存之间的性能差距的重要技术。尽管数据预取的概念已经被提出了数十年,但是......
数据预取是通过隐藏访存延迟改善应用性能的有效方法.反馈式优化技术可以解决基于指针的链式数据结构的预取问题.本文在申威1600处......
大规模时变科学数据可视化处理通常要按时间步分解输入,形成帧序列.每一帧的处理需至少经历数据载入、处理与绘制三个步骤.由于数据......
DDR3已经逐步进入了PC机的时代,对DDR3内存进行深入地分析和研究很有必要.本文从计算机硬件技术分析的角度,结合与DDR2的比较,对DD......
为了融合自主导航技术和LBS技术的优点,该文的目标是——设计实现基于地图的LBS.因而,在分析各种导航技术和LBS技术的现状和问题的......
由于存储器和处理器速度差距的日益增大,访存延迟已经成为限制程序性能的主要瓶颈.数据预取通过提前将数据取入缓存,可以掩盖访存......
存储系统逐渐成为网络服务器系统的主要瓶颈。为了提高存储系统性能,当前研究的明显趋势是通过对应用负载进行分析,针对访问特征对数......
基于应用行为分析的优化方法是计算机系统性能优化研究的重要内容。存储系统对访问模式的敏感性,使得基于存储模式进行性能优化的方......
数据访问延时是影响系统性能的关键因素之一。在MapReduce环境中,由于输入数据远大于处理代码,不在数据节点执行的Map任务将会引起大......
随着集成电路制造工艺的快速发展,处理器与主存之间的性能差距不断扩大,访存延迟对处理器性能的制约日益严重。同时,电源电压等比例缩......
随着异构平台的兴起,高性能计算领域获得快速的发展。基于CPU+GPU的异构平台在以生物信息学、医学成像和计算流体力学等为代表的诸......
矢量线可视化法以其能表示矢量场的连续性,绘制效果直观而广泛应用在工程实践中,已成为流场可视化的重要方法。随着科学模拟精度不......
二进制翻译作为实现代码移植的一种软件手段,能将某一体系结构下的可执行二进制程序在没有其源代码的情况下翻译转换成能在其它体......
随着互联网规模的日益增大,需要处理与存储的数据量也越来越多,云计算已经成为一种典型的解决方案。目前,云计算已经受到学术界与......
伴随互联网爆炸性的发展,网上信息浩如烟海,普通网络用户想找到所需的资料难于大海捞针,所以迫切需要一种优异的搜索服务,将网上繁杂的......
学位
移动数据库中数据广播技术及移动通信带宽的有限性引起较大的数据访问延迟,移动客户机与固定网络频繁(主动或被动)断接使得用户事......
异构HPL(high-performance Linpack)效率的提高需要充分发挥加速部件和通用CPU计算能力,加速部件集成了更多的计算核心,负责主要的......
网络地图是展示全球实时网络拓扑结构和网络资源的电子地图,网络地图在网络安全攻防、网络故障排查、网络资源探测等多方面具有重......
可重构计算技术已应用于众多高性能计算领域,如多媒体处理、无线通信、气象模拟、分子计算等,已成为未来高性能计算架构的重要发展......
随着信息时代的飞速发展和用户数据量的快速增长,数据库的性能变得越来越重要。主存哈希连接算法作为数据库连接操作的一种实现,具......
在现代计算机体系结构中,处理器需要不断与存储系统进行交互以读取和写入数据。但随着现代处理器架构和微体系结构设计技术的不断......
Spark是大数据内存计算系统的典型代表,通过基于内存的数据缓存加速迭代型、交互式等大数据应用的运行。基于时间窗口的数据分析是......
大规模图计算分析已经成为目前众多数据分析应用的重要组成部分。图(Graph)作为最基本的抽象数据结构之一,常常被用来表示不同个体......
随着多核时代的到来,处理器与存储器之间日益增大的性能差距加剧了“存储墙”的问题。数据预取技术是解决此问题的一种有效措施,它......
数字高程模型(Digital Elevation Model, DEM),是一个用数值矩阵表示地面高程的实体地面模型,是重要的地形数据之一。现有DEM数据......
本文主要研究两阶段预取评估策略,在构建及执行阶段对数据预取线程的预取效果进行评估,选择更高效的数据预取线程。模拟结果表明......
针对读取数据这一制约绘制性能的主要因素,从时变数据场的相邻帧相似性入手,利用前一帧图像的绘图区域预测下一帧图像的绘图区域,......
本文在研究ORC编译器反馈式编译优化技术的基础上,针对Alpha结构的特点,对针对链式结构的反馈式数据预取进行了优化。SPEC2000测试表......
基于可动态独立调整运行频率/电压的多功能部件配置结构,在分析已有数据预取优化方法的基础上,创新性地提出了一种低功耗的数据预......
鉴于现有的数据预取算法不能满足高效能异构计算系统对动态随机存取存储器(DRAM)和非易失性存储器(NVM)相结合的新型异构存储器高效访......
传统数据预取技术在处理结构复杂的非规则数据应用程序时,其有效性明显下降.为解决该问题,基于程序运行时的数据访问阶段性特征,提......
论文提出了基于重叠裁剪盒的环境漫游技术.在预处理过程,在场景中布置立方体裁剪盒.使用裁剪盒对场景几何体分割,以裁剪盒为单位存......
多核技术的出现使得微处理器的性能持续提高,此时处理器与存储器间的速度差异问题成为限制处理器性能发挥的一个主要因素。本文针......
DSP作为嵌入式系统的核心部件,广泛地应于智能终端、通信设备、多媒体处理等领域。应用需求的不断发展,要求DSP具有更高的性能、更低......
由于链式数据结构的存储缺乏空间局部性,导致程序执行过程中对链式数据的访问会发生严重的Cache缺失行为.通过对面向链式结构的线......
块执行模型通过将串行程序划分成一系列可并行执行的指令块来挖掘应用中潜在的指令级并行性.访存延迟是阻碍块执行模型提高指令级......
片上多处理器中不同核的缺失地址序列之间通常存在一定的空间和时间相关性,为了充分利用该性质,本文提出时空结合的数据预取.该机......
双精度普通矩阵乘法DGEMM函数是高性能计算基础软件BLAS库中最重要的第三级函数.本文针对龙芯3B1500处理器体系结构的特点,利用保......
期刊
Intel Xeon Phi协处理器作为现阶段极具代表性的众核产品之一,为应用程序提供了强大的硬件环境和计算资源.然而,Xeon Phi所采用的......
在KD-50-I平台上,基于常用优化技术,根据龙芯2F体系结构的特点,在数据预取、指令调度方面,针对高性能计算机系统中能有效解决线性......
微处理器芯片的处理能力越来越强.但是,存储器的速度却远远不能与其匹配,造成了整个系统的性能不理想.为解决这个问题,编译器发展......
YHFT-DX是国防科技大学自主研制的一款高性能DSP.以提升YHFI-DX的 Cache 性能为目标,研究了降低 Cache 失效延迟的优化策略,设计并......
随机搜索是用户在享受视频点播服务时常见的行为,它使得播放进度发生突然变化,同时要求系统做出及时的响应.为了缩短数据访问的响......