论文部分内容阅读
矩阵运算是科学与工程计算中的基本运算,广泛应用于数字信号处理和图像处理等各个领域。上述应用领域的实时性要求很高,为加快矩阵运算速度,需采用硬件实现的方法。而矩阵求逆运算是简化和解决很多问题的关键环节,其执行速度对整个系统的效率有重要的影响。针对现有的矩阵求逆硬件实现方法大多有硬件资源复杂度大、存储资源需求大或仅适用于低阶矩阵等缺陷,本文提出了一种基于LU分解的矩阵求逆运算的硬件实现方法。该方法基于简单的加减乘除运算单元,设计了三个计算模块完成矩阵求逆运算,通过重构的方式实现各个模块的运算,节约了超过50%的硬件资源,具有低功耗、低硬件资源复杂度的特点;并对三个模块分别设计了并行化方法,并设定相应的存储规则以实现并行访存,根据硬件资源本设计采用四路并行的方式,有效提高了运算效率和硬件资源利用率。随着SoC设计技术遵循摩尔定律规律快速发展,芯片规模和功能的急剧膨胀也导致了验证复杂度的快速增长,验证的工作量指数级增长,验证效率越来越成为制约设计效率的瓶颈。传统的验证方法已经无法满足对于大规模的复杂的芯片设计的验证。因而,近年来不断涌现出大量新的高级验证方法学。面对利用重构方式实现的矩阵求逆设计,需要对大量的不同阶数的矩阵数据进行验证,本文采用了目前验证技术的最新进展UVM (Universal Verification Methodology)验证方法学,搭建了一个高效、高度自动化、可重用的验证平台,极大地提高了验证效率。通过随机约束结合随机产生激励的方式,生成所需的矩阵求逆设计的配置信息以及随机的矩阵数据,通过大量的随机测试可以快速达到功能覆盖率100%的要求,保证模块设计的功能正确性。同时,通过运行时间的统计以及计算精度的统计,对设计模块的性能方面进行分析。最终得到对矩阵求逆模块设计的完备的验证结果。