基于LU分解的矩阵求逆运算的硬件实现与验证

来源 :南京大学 | 被引量 : 0次 | 上传用户:guoguangyun_09
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
矩阵运算是科学与工程计算中的基本运算,广泛应用于数字信号处理和图像处理等各个领域。上述应用领域的实时性要求很高,为加快矩阵运算速度,需采用硬件实现的方法。而矩阵求逆运算是简化和解决很多问题的关键环节,其执行速度对整个系统的效率有重要的影响。针对现有的矩阵求逆硬件实现方法大多有硬件资源复杂度大、存储资源需求大或仅适用于低阶矩阵等缺陷,本文提出了一种基于LU分解的矩阵求逆运算的硬件实现方法。该方法基于简单的加减乘除运算单元,设计了三个计算模块完成矩阵求逆运算,通过重构的方式实现各个模块的运算,节约了超过50%的硬件资源,具有低功耗、低硬件资源复杂度的特点;并对三个模块分别设计了并行化方法,并设定相应的存储规则以实现并行访存,根据硬件资源本设计采用四路并行的方式,有效提高了运算效率和硬件资源利用率。随着SoC设计技术遵循摩尔定律规律快速发展,芯片规模和功能的急剧膨胀也导致了验证复杂度的快速增长,验证的工作量指数级增长,验证效率越来越成为制约设计效率的瓶颈。传统的验证方法已经无法满足对于大规模的复杂的芯片设计的验证。因而,近年来不断涌现出大量新的高级验证方法学。面对利用重构方式实现的矩阵求逆设计,需要对大量的不同阶数的矩阵数据进行验证,本文采用了目前验证技术的最新进展UVM (Universal Verification Methodology)验证方法学,搭建了一个高效、高度自动化、可重用的验证平台,极大地提高了验证效率。通过随机约束结合随机产生激励的方式,生成所需的矩阵求逆设计的配置信息以及随机的矩阵数据,通过大量的随机测试可以快速达到功能覆盖率100%的要求,保证模块设计的功能正确性。同时,通过运行时间的统计以及计算精度的统计,对设计模块的性能方面进行分析。最终得到对矩阵求逆模块设计的完备的验证结果。
其他文献
该文就FDTD(时域有限差分)方法应用于电磁散射计算进行了研究,着重讨论了吸收边界条件;总场散射场分区计算;用一维FDTD方法引入入射波;网格自动化分;散射场近区信息的提取;在
学位
细胞迁移是一个重要的生命活动。其中小GTP酶Cdc42发挥了关键的调节作用。因此对其活性水平的精细调控便对细胞十分重要。Cdc42在细胞的运动前缘被其鸟嘌呤核苷酸交换因子(GE
该文以多通道测温测压数据采集系统的研究设计为中心,提出了以8031微处理器为核心的单片机数据采集、处理、控制系统的设计方案,并按功能分割的模块化设计实现思想,对数据采
学位
学位
近年来,对活细胞内的线粒体、RNA等亚细胞粒子在三维空间中动态过程的研究,已成为当前生物研究领域的焦点和难点,解决这一问题将有助于揭示生命的本质、神经活动的机制和癌的病
学位
该文在简单回顾FDTD法基本原理的基础上,提出了一种柱坐标系下FDTD法的二阶吸收边界条件,并进行了验算;针对现代隐身技术的发展,探讨了FDTD法中对薄吸波层建模的问题,在二维
学位