LU分解在Godson—Tv1众核体系结构上的并行化研究

来源 :计算机学报 | 被引量 : 0次 | 上传用户:huhuairen
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着集成电路工艺的发展,众核体系结构成为人们日益关注的计算平台.LU分解是科学和工程计算中被广泛使用的核心算法之一,尽管在传统的并行体系结构上已有大量的并行化研究工作,但是结合新型众核体系结构特征的工作还不多.文章从负载均衡、延迟容忍和性能分析模型3个方面系统研究了LU分解在众核体系结构上的并行化问题.该文的贡献在于:首先,针对二维卷帘负载分配方案难以达到良好负载均衡的缺点,提出一种新的“之”字形分配方案,实验表明不经任何优化的情况下性能比前者提高20%,优化后达到了40%;其次,提出了一个性能加速比的分
其他文献
随着人们对网络服务的依赖性日益增强,网络服务系统的服务质量和可用性变得至关重要.然而,服务系统的日益复杂化及第三方软件和异构中间件系统的大量部署,为各种软件缺陷提供更多
目的探讨组织瓣移植在头颈部肿瘤术后组织缺损修复中的应用。方法观察38例头颈肿瘤术后组织瓣移植,分析所采用皮瓣的类型受区血管,皮瓣成活情况及并发症的发生情况,并分析有
目的分析观察静滴丙种球蛋白治疗基层医院小儿常见的病毒性心肌炎的疗效。方法将290例患儿分成治疗组150例,对照组140例。治疗组除常规治疗和护理外,加用丙种球蛋白治疗,每日
从可证明安全的角度研究使用压缩函数的非平衡Feistel结构(UFN—C)的安全性,证明了k+1轮UFN-C是伪随机的,k+2轮UFN—C是超伪随机的;进一步地,探讨了UFN—C的有效构造,降低了Naor和Rein
提出了一项光线跟踪新技术,能有效提高光线在空白区域的行进速度.该技术首先用一种新方法创建均匀空间网格,然后用较少的空盒自适应聚集空的空间网格,以加快光线跟踪的计算.新加速结构的创建时间复杂度和空间复杂度均是O(n),而相应的光线跟踪计算的时间复杂度为O(logn),与kd树结构相当.当该结构与已有的一些加速结构结合后,能很好地处理大规模动态场景.比如,光线逐根跟踪且计算二次衍生光线时,新技术可在普
建立了面向任务的陆基卫星测控资源优化调度数学模型,与已有数学模型不同的是,该模型约束同一测控请求同一时刻只被一个可见陆基测控设备测控,为调度算法调度陆基测控设备完成更
目的探讨NF-ΚB和Bcl-2在胃癌组织中的表达及意义。方法应用免疫组化二步法对63例胃癌组织中NF-ΚB和Bcl-2的表达情况进行检测。结果 NF-ΚB的表达与胃癌的分化程度、浸润深
目的探讨我院ICU病房神经外科患者并发高钠血症的原因、发病机制、对患者预后的影响及护理对策。方法回顾性分析219例神经外科患者中发生高钠血症的临床资料临床转归。结果出
针对市场上应用的各类创面敷料进行总结归纳和分析,得出理想敷料的设计要求和特点,为下一步的研究开发提供理论依据。
目的观察胃癌肉瘤组织中的血管生成拟态(VM)。方法采用免疫组化SP法和PAS染色技术,对27例胃癌肉瘤分别进行VEGF与PAS、CD31与PAS的双重染色,计算MVD、VMD及GF表达量,并分析其相