基于FPGA的矩阵奇异值分解加速方案的设计与实现

来源 :北京交通大学 | 被引量 : 6次 | 上传用户:eastphoto
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
奇异值分解(singular value decomposition)是数值计算学科中的一个重要组成,并且在诸如无线通信领域的大规模MIMO、图像处理领域的特征提取及主成分分析、机器学习领域的数据压缩、词义索引和大数据领域的数据相关性分析中都发挥着至关重要的作用。奇异值分解算法是计算复杂度相对较高的矩阵分解算法,而且随着数据处理规模的不断增加,无论在通信方向的大规模MIMO中,还是对于矩阵维度及数据量都更加庞大的图像及数据挖掘等研究与应用场景中,对于奇异值分解的运算速度都有越来越高的需求,因此对矩阵奇异值分解的加速方案实现具有很高的研究与应用价值。本文重点研究了基于单边Jacobi方法的矩阵奇异值分解,该算法具有相对精度高、分解速度快的特点,是一种非常适合并行化和大规模矩阵计算的一种旋转运算方法。对于Jacobi算法而言,旋转变换和列对排序对分解的速度有决定性作用,本文对不同的矩阵列对索引方式进行了研究,并将两种序列生成方式,循环序列和指环序列应用到硬件设计当中。其中指环序列的列对排序方式,不仅利于并行化实现,而且可以得到有序排列奇异值矩阵,并对算法的收敛速度也有积极的促进作用。针对实时性、低延迟需求,本文提出了基于片上存储的循环序列单边Jacobi变换算法硬件架构,其性能相比于相同算法的MATLAB方案和GPU方案有很明显加速效果,保持了相当的数值精度。在此基础上,设计实现了一种基于片上存储以及指环序列方式的并行化硬件加速方案,相比于循环序列方式,实测加速比达到2.95倍。其次,针对大规模、高吞吐率的图像处理以及数据挖掘等应用场景,为解决片内存储容量与硬件设计复杂的问题,提出了基于片外存储器和指环序列的单边Jacobi算法的并行架构设计,并且基于性能与资源的关系,提出了其在并行化硬件设计上性能与资源的平衡策略。
其他文献
激光诱导击穿光谱(LIBS)技术的分析灵敏度会明显受到等离子体中电子轫致辐射的影响。由于电子轫致辐射的弛豫时间一般比原子辐射的弛豫时间短,因而可以采用时间分辨的信号检
加强财务监管是防范风险的有效途径。财务人员要不断提高自己的综合素质,依法履行自己的监管职能。 Strengthening financial supervision is an effective way to prevent
目的探讨急性有机磷农药中毒的急救方法与护理效果。方法回顾分析2010年1月至2013年12月我院收治的73例急性有机磷农药中毒患者的抢救及护理等临床资料。结果本组73例患者经
分布式阵列是一种新型的阵列体制,灵活的阵列布局,独特的子阵结构,使其具有多样的可重构性、灵活的机动性及较好的抗打击能力,并因此逐渐应用于现代战略雷达体制中。此外,分
目的探讨梗阻性黄疸术后急性肾功能衰竭的相关影响因素。方法 82例梗阻性黄疸患者,按照是否出现急性肾功能衰竭分为肾衰竭组及无肾衰竭组,比较2组年龄、术前肾功能、肝功能、
目的分析评价恩替卡韦联合复方鳖甲软肝片治疗慢性乙型病毒性肝炎肝纤维化的临床疗效。方法将该院于2017年2月-2018年2月收治的84例患者平均分为两组,对照组单用恩替卡韦医治
目前有关二维PSD(Position Sensitive Detector,光电位置敏感探测器)非线性校正方法相对较多,但大都停留在定性分析阶段。尽管对二维PSD的结构及使用材料等方面进行了改进,但
对遵义市近16年城镇居民可支配收入与畜牧业温室气体排放进行分析,探讨城镇经济发展与畜牧养殖业温室气体关系。结果表明:(1)研究期间遵义市畜牧产业的温室气体排放量呈降低
太阳能电池又叫做“光伏器件”,是利用物质受到光辐射时吸收光子引起电荷分布发生变化以致产生电势和电流从而将光能变成电能的器件。基于晶体硅等无机太阳能电池已经达到了
OLED(Organic light emitting diode)被认为是将取代LCD的下一代主流显示技术,但是目前OLED还只是被大规模的用于智能手机等小型设备中,要真正的将OLED的诸多优势淋漓尽致的