CPU+GPU异构并行的矩阵转置算法研究

来源 :东北师大学报:自然科学版 | 被引量 : 0次 | 上传用户:zimuogu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
针对当前算法优化研究一般局限于单一硬件平台、很难实现在不同平台上高效运行的问题,利用图形处理器(GPU)提出了基于开放式计算语言(OpenCL)的矩阵转置并行算法.通过矩阵子块粗粒度并行、矩阵元素细粒度并行、工作项与数据的空间映射和本地存储器优化方法的应用,使矩阵转置算法在GPU计算平台上的性能提高了12倍.实验结果表明,与基于CPU的串行算法、基于开放多处理(OpenMP)并行算法和基于统一计算设备架构(CUDA)并行算法性能相比,矩阵转置并行算法在OpenCL架构下NVIDIA GPU计算平台上分别获
其他文献
对一类圈上有奇数个节点的太阳图进行边魔幻优美标号研究,得到了其超级边魔幻优美标号和边魔幻全标号,并对特殊的广义太阳图确定了其边魔幻优美标号和边魔幻全标号.提出了一种新
在农村网络购物消费需求的刺激下,发展农村电子商务对于提高农村居民生活质量、加快农村信息化建设和进一步推动电子商务的发展具有重要的现实意义。本研究拓展并丰富了农村
我院近几年来门诊及病房收治的126例病例作一分析.一般资料本院1999年至2003年4月门诊及病房糖尿病患者474例其中并发感染126例,感染率为26.6%,14~80岁;男51例,女75例;病程≥5
运用亚纯函数的Nevanlinna理论及整函数的相关理论,研究了复方程,f^(k)+At-1f^(k-1)+……+A1f^1+A0f=0。的无穷级解的角域测度及Borel方向.
提出了一种有效处理冲突证据的融合方法.该方法综合考虑了D-S证据组合规则的不足及修正数据源方法的可靠性高的特点,首先引入证据距离对冲突证据进行检验;然后计算冲突证据在
随着高科技技术的普及应用,对于我国农业的发展起到了促进的作用效果。本文对于国内的温室大棚智能控制系统进行深入的分析,供相关人士进行参考。
多发性硬化(multiple sclerosis,MS)是常见的中枢神经系统自身免疫性疾病,全球约有2.5亿患者,多于30~40岁起病。MS的特征是神经髓鞘脱失及渐进的轴突和神经元变性,最终导致严重
从耕地破碎化程度入手,以吉林省长春市九台区为研究对象,结合相关研究及研究区实际情况选取面积、形状、分布三方面共6个评价指标构建了耕地破碎度评价体系,运用层次分析法和
目的:探讨延续性护理在改善慢性心力衰竭患者生活质量和自我管理能力中的临床意义。方法:将130例患者随机分为观察组和对照组,每组各65例。对照组采用常规护理进行干预,观察组
研究了图(s〈C4,3〉)∪Pm的优美性,证明了当s为大于等于2的自然数,m为任意正整数时,图(s〈C4,3〉)∪Pm是优美的.其中图〈C4,3〉是将3个C4中每个C4的一个顶点粘接到一起得到的新图