访存相关论文
本文的目的是设计-32位RISC的嵌入式微处理器(取名为MoonCore)。 在对嵌入式微处理器通用结构研究的基础上,参考MIPS I指令系统,......
低效率的访存操作是限制微处理器性能提高的一个关键因素。本文提出了一种 Load/ Store 缓冲模型,分析了这种模型协调微处理器和存储器之间速......
针对龙芯3A体系结构以及二级BLAS库函数的特点,在指令级、存储级和线程级抽取并行方案,总结了一些合适的优化方法,并对其进行了定量的......
强大的计算能力使得GPGPU在通用计算领域得到了广泛的应用。然而,GPGPU的SIMT(Single Instruction Multiple Threads)工作方式,使其......
针对多核中访存密集的特点,对一种基于优先级表达式的突发调度策略(Priority-Equation-Based Burst Scheduling,PEB—Burst调度)进行了......
TSP(旅行商问题)问题是数图论领域中著名问题之一,常采用基于种群的智能算法来解决,其中最具代表性的就是遗传算法.但由于用遗传算法......
在参数化LogP模型(PLogP模型)的基础上,针对异构多核并行系统通用核和加速核的异构性、存储的层次化、并行执行的层次化特征,提出了新......
针对流处理计算模式中的任务分配不平衡问题,提出一种资源动态分配的硬件调度机制。该机制通过实时监测各个任务的计算量,动态地调节......
针对“一个RISC主处理器核+几个专用协处理器核”结构的计算密集型SoC,设计一种以执行命令方式完成大块数据传输的高效访存结构。通......
针对基础数学库中的寄存器分配特点,提出一种基于多级分层策略的寄存器分配策略。考虑各类寄存器的使用特点,采用多级分层模型,合......
访存相关和访存冲突是向量计算机多端口存储器设计中所要解决的关键问题.本文分析了在单处理机系统中,具有四个端口,按交叉访问方......
为加速卷积神经网络的前向推理速度,提出一种针对卷积操作访存连续性的优化策略。在深度学习框架Caffe中,卷积以矩阵乘法的形式实......
当前,图形处理器(GPU)广泛应用在图形图像处理、科学计算、多媒体应用、数据挖掘、金融计算等众多科学和工程领域。GPU采用单指令多数......
面向众核处理器提出一种访存链路接口的现场可编程门阵列(Field-Programmable Gate Array,FPGA)验证平台,用于对处理器访存链路关键......
自从集成电路诞生以来,对于集成电路设计的验证一直是集成电路设计的重要环节。到目前为止集成电路设计过程中对于验证所投入的时......
硬件数据预取技术可以有效提升处理器的访存性能,是申威处理器性能优化过程中亟需突破的一项技术。硬件开销和处理器架构的制约是......