基于矩阵三角化分解的Cholesky分解及FPGA并行结构设计

来源 :清华大学学报(自然科学版) | 被引量 : 0次 | 上传用户:kfyddp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
矩阵运算是高性能计算中核心问题之一,矩阵分解是提高矩阵运算并行性的重要途径,飞速发展的FPGA为并行运算结构提供了有力的环境支持。该文基于子矩阵更新同一化算法实现了Cholesky分解,基于FPGA设计了相应的并行结构。实验结果表明:与通用处理器的软件实现相比,本文实现的Cholesky分解的FPGA并行结果在核心计算性能上可以取得10倍以上的加速比,该算法针对矩阵三角化计算过程具有更高的数据和流水并行性。 Matrix computing is one of the core problems in high performance computing. Matrix decomposition is an important way to improve the parallelism of matrix computing. The rapid development of FPGA provides powerful environment support for parallel computing architecture. This paper implements the Cholesky decomposition based on the sub-matrix updating and homogenization algorithm, and designs the corresponding parallel structure based on FPGA. The experimental results show that compared with the general-purpose processor software, the parallel results of the Cholesky decomposition achieved in this paper can achieve more than 10 times the speedup in the core computing performance. The algorithm has higher data for the matrix triangulation calculation process And water parallelism.
其他文献
在近几年的高考试题中,考查排列组合的内容多以选择题或填空题的形式出现.在解答这类问题时,常规题型可用常规方法处理,但对一些较复杂的问题(例如分类与分步相结合、多重限制问题等),对学生的思维要求就很高,要使学生做到不重不漏是相当有难度的.笔者结合实际教学发现:除一些常规方法外,还可采用列举法, 当然这里的列举法,应该说是改良的列举法,即“局部列举法”.其中又可分为两类,一是在“难点处”列举;二是通过