大规模矩阵求逆运算电路设计与优化

来源 :东南大学 | 被引量 : 0次 | 上传用户:jianjiaomylove
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
矩阵运算是科学计算与工程计算中的基本问题,在信号处理领域中有着广泛的应用。其中矩阵求逆运算占有相当重要的地位。在大规模MIMO系统、阵列信号处理以及图像信号处理等场景中,随着数据规模呈几何级数增长,矩阵求逆的运算速度往往成为影响系统性能的关键。因此,本文主要针对大规模矩阵求逆问题,设计单精度浮点数的高阶实矩阵求逆硬件加速电路,提高矩阵求逆运算电路的吞吐率。本文首先通过对多种矩阵求逆算法的适用性、计算复杂度、以及硬件实现难度等角度的对比分析,选择基于Cholesky分解的矩阵求逆算法进行硬件实现;为了实现电路的高吞吐率,采用流水线并行结构作为本文电路设计的架构基础。基于Cholesky分解的矩阵求逆算法将矩阵求逆过程分为Cholesky分解、下三角矩阵求逆以及三角矩阵相乘三个步骤。本文通过分析三个步骤的数据依赖关系,分别对Cholesky分解、下三角矩阵求逆以及三角矩阵相乘进行基于线性PE阵列的细粒度并行任务划分,并以此为基础设计了PE单元,通过优化阵列结构减少了大量硬件资源使用。其中,针对下三角矩阵求逆,提出了按列进行任务分配的计算方式,通过转换计算顺序实现下三角矩阵求逆算法的并行执行,并通过对浮点乘累加器的设计进一步提高了吞吐率。本文将三个步骤的电路模块进行了整合,实现了最高5120阶矩阵求逆电路系统,误差精度在10-710-4范围内,满足信号处理的基本需求。最后本文根据算法执行过程以及电路延时等参数信息建立了大规模矩阵求逆系统的性能验证模型,从理论上对矩阵求逆电路进行性能分析,加快了对该类电路的性能分析速度。本文采用Nexys Video平台进行验证。结果表明:本文所设计的大规模矩阵求逆系统在FPGA片内集成32个PE单元的情况下,最高支持时钟频率为156MHz,吞吐率达到8.2GFLOPS,可支持325120阶矩阵的求逆运算。相比同类单精度浮点高阶矩阵求逆电路,在节省了20%以上硬件资源情况下吞吐率提高了4%。本文设计的电路满足了大规模矩阵求逆运算的需求,具有一定的工程应用价值。
其他文献
巨细胞病毒(HCMV)属于疱疹病毒β亚科。HCMV在成年人群中的感染率约为60%~100%.绝大多数为隐性感染。近年来,HCMV感染作为器官移植和艾滋病等免疫抑制病的病因之一.已受到越来越广
战术是现代足球的核心要素,直到20世纪80年代或90年代,战术评估一直是一个被忽视的变量。在过去的二十年中,战术评估的发展取得了长足的进步,确定了它在运动表现中的重要性。近年来随着赛场上攻防战术的快速转变,快速反击战术的应用越来越受到人们的重视,且快速反击战术的成功功率和进球率也在逐步提升,因此加强对此战术的研究有助于我们今后的训练与教学。本研究采用文献资料法、逻辑分析法、录像观察法以及梳理统计与
适配功率电机作为一种新型的驱动电机,主要适用于城市重载电动汽车。该电机实现了双绕组构成电枢绕组的结构创新,因而具有输出两种不同功率的功能特点。为了突出适配功率电机
随着微量有机污染物(Micro-organic contaminants,MCs)在我国以及世界各地水源中被频繁检出,水中MCs污染已成为全球性的环境问题。MCs化学结构复杂,稳定性较强,难以自然衰减,能潜在地、持久性地对人体产生危害。但由于其浓度低,传质阻力大,很难用传统的处理工艺去除。因此,克服传质阻力,提高MCs在材料表面的吸附,发展具有大比表面积、强吸附-光催化活性、能高效去除水中MCs的
消防安全建设的标准化,具有重要的意义。各发射台具有了统一消防安全建设的标准,更有利于管理和工作的开展。这套统一的发射台消防安全建设标准,具有可操作性强、可学习性强
“三支一扶”是一项基于基层人才培养与人才服务基层并重的项目,有效缓解了城乡,特别是中西部地区、乡村人才匮乏的现状。从2006年至今,随着项目的深入实施,服务岗位不断创新
目的探讨冠心病临床护理中认知行为干预的价值。方法将70例冠心病患者依据治疗方法分为常规护理干预组(对照组)和认知行为干预组(观察组)各35例,统计分析两组患者的疾病知晓
在混凝土预制构件安装中,应用BIM技术可实现预制构件建模、碰撞检查、混凝土构件吊装模拟、复杂节点安装模拟、BIM项目管理等功能。通过利用BIM技术对预制构件的吊装安装、安
土壤是各类微生物生长的温床,但各类微生物同样也对土壤产生了非常大的作用,由于不同类型微生物在物质转化上所产生的作用是不同的,通过综合利用微生物能够对土壤肥力进行调