嵌入式环境下浮点矩阵乘法的FPGA加速关键技术研究

被引量 : 0次 | 上传用户:li_qinglong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
浮点矩阵乘法是数字信号处理的基础算法,在通信、网络、工控、医疗等领域有着广泛的应用。随着嵌入式系统在这些领域的深入应用,浮点矩阵乘法由于其计算复杂度高、处理效率低,通常成为提升嵌入式系统在这领域计算速度的瓶颈。现场可编程逻辑阵列(Field Programmable Gate Array,FPGA)协处理器因其速度快、可编程、使用灵活等特点,而成为提升嵌入式系统的计算速度的一种有效方式,受到了国内外研究者的广泛关注。因此,研究嵌入式环境下的浮点矩阵乘法FPGA加速有着非常重要的意义。本文针对三维荧光数学分离算法中浮点矩阵乘法的计算问题,在分析浮点矩阵乘法算法与FPGA硬件结构的基础上,研究了一种基于并行结构的流水线浮点矩阵乘法器以及异构多处理器下的通信机制,以提高嵌入式环境下浮点矩阵乘法的FPGA计算性能,具体工作如下:针对矩阵乘法的核心计算单元乘法累加器,分析每个时钟周期中乘法累加的计算过程,在浮点乘法器和加法器知识产权核的基础上,提出了一种流水线浮点乘法累加器结构。该结构中数据在经过流水线乘法器和加法器之后,只需计算加法器的最后N级流水线结果之和即可得到所计算的累加和。此外,该结构使用灵活、适用性好,可根据实际需求调整流水线的级数以适应不同应用的性能需求。在上述乘法累加器的基础上,本文研究设计了一种并行架构下的浮点矩阵乘法器,降低了计算复杂度,提升了计算速度。该矩阵乘法器可以配置两个相乘矩阵的行列参数,并且可以根据实际的FPGA资源情况设置处理单元的数目,而相邻的处理单元之间没有数据的交互,具有良好的扩展性。针对浮点矩阵乘法的FPGA协处理器与嵌入式CPU的通信问题,本文设计了基于串口UART口PCI-E总线的两种通信结构。在PCI-E的通信结构中,将基于片上可编程系统结构的FPGA端设计与嵌入式上位机的驱动程序相结合,实现软硬件系统的协同工作。本文基于Verilog硬件描述语言实现了浮点乘法累加器和矩阵乘法,并从仿真、综合等方面对其性能进行了分析。为了进一步验证其在嵌入式环境中的性能,分别实现了浮点矩阵乘法通过UART、PCI-E与本文所依托项目中的Intel E6x5C嵌入式平台的通信。实验结果表明,采用高速PCI-E总线加速浮点矩阵乘法计算的方式,能够比目前主流的Cortex A9和ARM9嵌入式平台对浮点矩阵乘法的计算速率分别提升了约8倍和200倍,因此该加速方式能够有效的提升嵌入式平台对浮点运算的计算性能。
其他文献
对导弹带有落角约束的制导与控制一体化进行了研究。首先建立了俯仰通道的制导控制一体化状态模型。然后利用特征结构配置方法,设计了制导与控制一体化状态反馈控制律。所设
皮肤角质层(SC)位于表皮的最外层,具有独特的结构、物理和生化特性。可能引起由终末分化的角质细胞和镶嵌于其中的脂质基质组成,是机体的重要保护屏障,能抵抗外源性有害物质
通过2524-T3铝合金的搅拌摩擦焊接头疲劳性能对比试验,得到了母材、FSW对接接头、铆钉连接接头的疲劳S-N曲线。试验表明,搅拌摩擦焊的疲劳裂纹大多数起源于焊缝底部;2524-T3
微量元素硼是生物体必需的营养元素,但过量会使生物体产生毒理反应。随着金属冶炼、玻璃、日化和制药等工业的发展,水环境中硼的污染日趋严重。此外,海水的淡化利用也受到海
互联网技术普遍运用,尤其是web2.0时代到来以后,区别于传统媒介的新媒介迅速发展,开启了网络人际传播。其中以即时聊天和微型博客为代表的“自媒体”(we media)更开创了新的信息传
介绍了案例研究方法的源流,分析了信息系统研究中案例研究法的具体应用,评价了案例研究法的优越性及局限性。
阐述了国内外信息成本研究现状,认为信息成本的研究主要有五种视角,即制度视角、商品视角、技术视角、交易视角和管理视角。指出仍有许多信息成本相关的问题存在争议或尚未研
将具有优良亲水性的丝胶包覆在经碱减量处理的异形涤纶织物表面,以改善织物吸湿性能差、透气性差等问题。选用太古油、柔软剂、丝胶为原料,经超声震荡处理制得丝胶改性剂,然
在机车运行过程中,牵引电机为机车持续提供动力,是保证机车安全、顺利运行的关键部件。在机车车辆的高速和重载两大发展方向下,牵引电机的功率密度在不断增加,对其散热性能和
为提高滚动轴承设计计算的效率,研究和开发了滚动轴承设计计算软件系统。将数据库技术应用到滚动轴承设计计算中,研发的软件系统能够方便地计算、选择机械设计中的常用滚动轴