访存相关论文
针对龙芯3A体系结构以及二级BLAS库函数的特点,在指令级、存储级和线程级抽取并行方案,总结了一些合适的优化方法,并对其进行了定量的......
强大的计算能力使得GPGPU在通用计算领域得到了广泛的应用。然而,GPGPU的SIMT(Single Instruction Multiple Threads)工作方式,使其......
TSP(旅行商问题)问题是数图论领域中著名问题之一,常采用基于种群的智能算法来解决,其中最具代表性的就是遗传算法.但由于用遗传算法......
在参数化LogP模型(PLogP模型)的基础上,针对异构多核并行系统通用核和加速核的异构性、存储的层次化、并行执行的层次化特征,提出了新......
针对流处理计算模式中的任务分配不平衡问题,提出一种资源动态分配的硬件调度机制。该机制通过实时监测各个任务的计算量,动态地调节......
针对“一个RISC主处理器核+几个专用协处理器核”结构的计算密集型SoC,设计一种以执行命令方式完成大块数据传输的高效访存结构。通......
针对基础数学库中的寄存器分配特点,提出一种基于多级分层策略的寄存器分配策略。考虑各类寄存器的使用特点,采用多级分层模型,合......
为加速卷积神经网络的前向推理速度,提出一种针对卷积操作访存连续性的优化策略。在深度学习框架Caffe中,卷积以矩阵乘法的形式实......
当前,图形处理器(GPU)广泛应用在图形图像处理、科学计算、多媒体应用、数据挖掘、金融计算等众多科学和工程领域。GPU采用单指令多数......
面向众核处理器提出一种访存链路接口的现场可编程门阵列(Field-Programmable Gate Array,FPGA)验证平台,用于对处理器访存链路关键......
自从集成电路诞生以来,对于集成电路设计的验证一直是集成电路设计的重要环节。到目前为止集成电路设计过程中对于验证所投入的时......
硬件数据预取技术可以有效提升处理器的访存性能,是申威处理器性能优化过程中亟需突破的一项技术。硬件开销和处理器架构的制约是......