矩阵乘法的GPU实现 - 论文文献免费下载 - 搜论网

矩阵乘法的GPU实现

来源 :科技传播 | 被引量 : 0次 | 上传用户：lifengxing0628

【摘要】

：

使用图形硬件来进行通用数值计算已经成为一个主流的讨论话题。以利用少量重用输入数据进行高度并行计算为代表的流算法的实现,已经广泛应用在GPU领域。其中密度矩阵乘法频繁的数据执行模式和高度并行计算的特点,使得矩阵乘法成为GPU高效计算的很好的一个选择。但令人惊讶的是,如此接近完美的GPU算法执行起来效率却不如目前采用的CPU缓存已知方式。我们发现导致这个现象的原因是在计算邻近的高速缓存时,GPU效率大

【作者】

：

林舒晞陈峰儿

【机构】

：

同济大学软件学院

【出处】

：

科技传播

【发表日期】

：

2011年21期

【关键词】

：

矩阵乘法 GPU

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

使用图形硬件来进行通用数值计算已经成为一个主流的讨论话题。以利用少量重用输入数据进行高度并行计算为代表的流算法的实现,已经广泛应用在GPU领域。其中密度矩阵乘法频繁的数据执行模式和高度并行计算的特点,使得矩阵乘法成为GPU高效计算的很好的一个选择。但令人惊讶的是,如此接近完美的GPU算法执行起来效率却不如目前采用的CPU缓存已知方式。我们发现导致这个现象的原因是在计算邻近的高速缓存时,GPU效率大大落后CPU,高速缓存带宽的限制降低了GPU执行计算重要重用数据的性能。

其他文献

特高压直流输电示范工程的分析

建设特高压输电工程是满足未来持续增长电力需求的保证,只有加快建设电压等级更高、网架结构更强、资源配置规模更大的电网才能满足电力输送和供应,保障社会发展目标的实现。

期刊

特高压直流输电典型示范工程

35kV所用变烧毁的事故分析

2009年8月22日，在某水泥厂35kV变电昕发生一起由于操作不当，加上配电柜本身存在的问题，导致一台S7-50／35／0．4变电昕所用变压器和90m的低压电缆烧毁事故。

期刊

35kV烧毁事故事故分析操作不当低压电缆水泥厂配电柜变压器

插管全麻食管镜下食管异物取出术104例体会

目的探讨插管全麻食管镜下食管异物取出术在临床应用中的价值。方法回顾性分析104例食管异物患者插管全麻下食管镜下食管异物取出术的临床资料。结果 104例全部成功取出异物,

期刊

异物取出术插管全麻食管镜

一种低功耗升压电荷泵

为消除电荷泵的动态功耗,本文用正弦时钟来代替传统上驱动电荷泵的方波时钟。新电路的功耗效率最大可以达到70%。

期刊

集成电路模拟集成电路电荷泵低功耗

重庆市电力公司安全工器具管控中心投运

近日，重庆市电力公司在永川供电局试点建设的安全工器具集约化智能管控中心建成并投入运行。

期刊

重庆市电力公司安全工器具管控投运集约化供电局

广西筹40亿资金补贴发电、电网、用电企业

8月31日，南方电网公司董事长、党组书记赵建国会见了来访的广西壮族自治区副主席杨道喜一行，双方就进一步加强政企合作、共解电力供应难题达成共识。

期刊

广西壮族自治区南方电网公司用电企业发电补贴资金电力供应董事长

低温射频等离子治疗阻塞性睡眠呼吸暂停低通气综合征的疗效观察

目的观察低温射频等离子治疗阻塞性睡眠呼吸暂停低通气综合征（OSAHS）的疗效。方法应用低温射频等离子技术对95例OSAHS患者行下鼻甲、软腭、舌根黏膜下射频消融术。观察患者术前

期刊

睡眠呼吸暂停射频消融上气道阻塞

静脉注射胺碘酮治疗急诊阵发性房颤的效果观察

目的观察静脉注射胺碘酮治疗急诊阵发性房颤的效果。方法急诊阵发性房颤患者100例随机分成对照组以及观察组,每组50例。对照组采用普罗帕酮治疗,观察组采用胺碘酮治疗。比较

期刊

静脉注射阵发性房颤胺碘酮治疗效果

治理轴封漏空提高机组真空严密性

凝汽器真空度是火力发电机组冷凝式汽轮机的一项重要指标,真空的好坏将直接影响到机组安全经济运行,如何提高机组真空的严密性也是凝汽式汽轮机所追求的共同课题。

期刊

汽封间隙轴封供汽真空严密性治理

科技论文的表现特征与审稿

根据科技论文各组成部分的表现特征对文稿的价值作出判断,从而决定文稿的取舍,不失为一种科技论文快捷审稿的方法。本文概述了科技论文各组成部分,即摘要、引言、实验、讨论

期刊

科技论文表现特征审稿

与本文相关的学术论文