CACHE优化相关论文
自RISC-V指令集架构开源公布以来,基于RISC-V架构的高性能处理器得到物联网等诸多行业的广泛应用,但是幽灵攻击的出现却在安全性方......
近年来,随着计算机和网络技术在世界范围内的普及应用,人类进入了数字化信息时代。与此同时,人们对信息与通信的需求日益突破地域......
针对移动对象的多用户连续K近邻查询处理问题,结合多核多线程技术的发展,提出了一种基于多线程的两阶段多用户连续K近邻查询处理框......
随着主流芯片厂商的大力推广,多核处理器已经变得越来越普及。以往串行化的程序设计方法在多核环境下已经不能充分利用多核CPU的资......
介绍了一种高速视频采集压缩系统的实现。该方案能够采集camera link摄像机视频信号或制式为PAL的视频信号;对采样后的数字视频数......
随着硬件技术的不断发展,计算机性能不断加强,数据库的性能也日益提高。但也造成了一些新问题,比如Cache延迟的加剧、Cache访问冲突等......
多核DSP具有极高的运算能力。介绍了基于TI公司多核DSP ( TMS320C6678)的多路信号实时解调实现方法,该芯片具有8个核处理器,在软件处理......
为了提高指令装载效率以达到实时编码,本文提出两项H.264编码的指令Cache优化措施:一是调整编码过程以避免宏块编码循环体内的指令码......
数字信号处理器大都采用两级高速缓存结构,为高复杂度算法的实现提供了有力的保证。由于一般片上内存空间不大,对于通信和图像系统......
针对移动对象的多用户连续K近邻查询处理问题,结合多核多线程技术的发展,提出了一种基于多线程的两阶段多用户连续K近邻查询处理框架......
Web集群的caching优化对提高系统性能起重要作用.从基于caching优化的角度出发,以事务为一个完整的划分单元,形成Web集群的缓存集.......
基于现代计算机的多级存储结构,采用消息传递并行编程模型对格子Boltzmann并行程序进行了Cache优化.实验结果表明,优化后的程序能够减......
具有病态规模的嵌套循环程序在进行循环分块时容易忽略分块因子对向量化的影响,导致非对齐数据访问,降低分块后循环代码的性能。提......
在采用并行超长指令字结构的DSP芯片中,CPU处理速度与片外数据存取速度不匹配的问题,导致了CPU处理延时,限制了DSP系统性能的提升.......
FFT(快速傅里叶变换)是用于计算离散傅里叶变换(DFT)或其逆运算的快速算法,它广泛应用于工程、科学和数学计算.到目前为止,鲜有基......
提出了一个编译时的Cache管理优化方法。该方法根据访存行为将程序中的数据划分成若干数据对象,根据数据对象的大小将Cache划分为一......