基于二维网格NoC的矩阵求逆加速实现

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:killer_lww
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
超级计算机的发展给了人们许多启示,依据“PC参考系准则”提出了多核研究的“超级计算机参考系准则”,即参考超级计算机的组织架构和发展历史进行多核系统研究。超级计算机理念中,程序的并行化是核心问题,而并行程序的核心是算法的并行。高密度计算问题的本质是矩阵运算,本文在研究软件和硬件多核之间关系的基础上,初步探索了大矩阵运算在多核系统优化实现技术,具体以大维度的复杂矩阵计算(分块、求逆、转置、三角化等)为对象,研究矩阵运算的并行算法,以及在同构多核结构下高密度计算的并行算法分解、再组合和任务分配过程。通过均衡多核系统的核间负载,寻找最小路由路径,优化资源分配,实现在高密度计算任务驱动下,充分挖掘多核系统并行能力,提高多核系统计算速度的目标。论文的主要内容如下:1.参考设计了基于二维网格结构的NoC同构多核系统。2.根据并行算法的理论,比较多种已有的矩阵求逆算法,选出一种并行度较高的基于块LU分解的矩阵求逆方法,挖掘其并行能力。3.遵循均衡多核系统的核间负载,减少同步开销、优化资源分配等原则,将矩阵求逆并行算法映射到二维网格NoC多核架构中,充分发挥多核系统的并行能力,提高矩阵求逆的计算速度。4.使用FPGA原型验证最终得到矩阵求逆并行算法在同构多核中的映射所得的加速效果。结果表明这种任务分配的方法是可行的,加速效果明显。
其他文献
具有中国民族风格的插画是在信息时代背景下产生的一种能够体现中国文化传统、美学思想、审美情趣等深层次内容的新风格的插画艺术形式,它的存在对中国插画的发展有这不可忽视
人类面临的能源危机促使各个国家都在寻找新能源以代替石油、煤、天然气等不可再生资源。而惯性约束核聚变(ICF)则是解决未来能源问题的潜在手段。电光开关是激光核聚变即惯
过去大多采用模拟的方法产生雷达信号波形,所需设备量大且信号精度不高,只能产生几种简单的波形。现代主要采取DDS技术产生雷达信号波形,运用直接数字频率合成产生任意复杂波
数模转换器是现代数字和模拟电路中用途十分广泛的重要接口部件,随着无线移动通讯技术的发展,对数据转换器性能的要求越来越苛刻。为满足当今高清晰数字音视频以及现代无线通
电子枪是一种不规则、易破损、多材质的电子产品,在流通的过程中由于受到振动冲击的作用易发生破坏,故应采用缓冲防振措施。本文主要研究电子枪的缓冲包装结构,并利用计算机
由于LDPC码具有性能极佳的纠错性能,被越来越多的通信标准所采用。2006年,国家广电总局颁布的自主研发的中国移动多媒体广播标准(CMMB)也采用了LDPC码作为信道编解码方案。CM
爬壁机器人能实现3维空间无障碍运动,设计并制备具有壁虎刚毛优点的粘附阵列,对爬壁机器人的研制和发展具有重要意义。本文提出了一种制备微纳阵列的新方法,以干膜为阵列材料
为了减小芯片电路的复杂度和芯片尺寸,高压双扩散漏MOS晶体管(High-Voltage DDDMOSFET)常常与深亚微米CMOS电路集成在一起应用于LCD驱动电路、智能电源管理芯片和许多特殊应
随着科学技术的发展,电能需求量日益增加,居民楼和公寓等用电户集中场所的电能采集情况和存在的问题也越来越多。现如今大多数的电能采集方案中,核心控制器采用的是单片机或