一种高带宽向量存储器的设计

来源 :第十七届计算机工程与工艺年会暨第三届微处理器技术论坛 | 被引量 : 0次 | 上传用户:Mciael
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  本文基于SIMD结构数字信号处理器X-DSP的向量访存需求,提出一种高效支持并行访问的高带宽向量存储器(PVM)的实现结构。该结构采用了特定的存储体分体设计和高效的并行访存仲裁器,以较低的硬件代价在向量访存流水线中完成了地址混洗和写回数据混洗,不仅实现了来自DMA读、写和两路向量访存流水线的四请求并行访问,而且支持高带宽SIMD非对齐的向量访存指令。针对DMA总线与向量存储器带宽不匹配的问题,设计了向量传输缓冲器VTB;最后给出了基于System Verilog的模块级验证方案和综合结果。实验结果分析表明,本文提出的技术能够有效提高非对齐访问的访存效率,并且缓解高速并行访存冲突导致的流水线停顿,提高向量存储器的整体性能。
其他文献
  设计实现了双通道快速核内DMA (IDMA)控制器.IDMA支持L1(L1P/L1D)、L2以及外部配置空间(CFG)之间进行数据传输,包括IDMA0和IDMA1两个通道.其中,IDMA0一次传输数据量最大
  Matrix2 DSP是由国防科学技术大学微电子所自主研发基于GCC支持64位指令的DSP,计算中有大量的32位操作。本文在Matrix2体系结构的基础上,简要分析了GCC内部编译的优化遍,
  Matrix DSP是一款用于无线通信领域的高性能DSP处理器,具有创新的体系结构和指令集,其应用的特殊性要求编译器系统必须支持一些不规则的指令,如无符号运算指令、扩展运算指
  在ARMv7指令集的基础上,通过对所有指令进行分析,选择其中的五类指令(数据处理,跳转,存取,块存取,乘法类)来设计一种32位RISC处理器内核。本文提出了一种分三条流水线来实现所
在研究和设计多核处理器上,模拟器发挥着至关重要的作用.Gem5模拟器是目前被广泛采用的多核处理器模拟器,但其不能实现对片外内存的真实模拟,针对Gem5模拟器的缺陷,设计实现了G
  本文提出一种基于大数据时代特征的Cache数据一致性结构。大数据时代下,有数据量大、数据类型多、数据处理快速和价值密度低四大特征,多核处理器中各本地Cache 只有少量的
  本文提出一种将基4FFT算法映射到Matrix多核向量处理器的向量化方法.针对Matrix体系结构的特点,将FFT算法的混洗需求和访存请求融合,减少了混洗模式;并通过软件流水的方法充
气体分馏装置的生产工艺是以催化裂化装置所产液化气(LPG)和延迟焦化装置LPG为原料,从中分离出较高纯度的丙烯产品,以满足不同化工装置的需求。   本文以国内某石化公司65万
通过对乙炔气相法合成醋酸乙烯催化剂生产及使用情况的分析,针对目前该催化剂在工业生产时将活性炭孔道堵塞、比表面积严重降低的问题,采用过量浸渍法研究了制备该催化剂的浸渍
在高性能处理器中实现乘后加运算指令,将能减少运算的计算延时和算法的迭代次数,提高处理器的计算性能。设计了一种6级全流水SIMD浮点乘加单元(FMAC),设计实现了九条浮点指令,支