CPU-OpenMP和GPU-CUDA并行计算技术对矩阵乘法运算的加速效果分析

来源 :科技视界 | 被引量 : 0次 | 上传用户:VIPYJS
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文对比了CPU-OpenMP和GPU-CUDA并行计算技术对不同阶矩阵乘法运算相对于CPU单线程计算的加速效果。结果表明,CPU-OpenMP并行的计算加速比与矩阵阶数无关,且低于所采用的线程数目。GPU-CUDA并行的计算加速比随矩阵阶数的增加显著增加,最大计算加速比可达570倍以上。相对于CPU单线程计算结果,CPU-OpenMP并行计算未产生误差,而GPU-CUDA并行计算会产生误差。结果表明,GPUCUDA并行适合高阶数矩阵乘法的加速计算,而CPU-OpenMP并行适合低阶数矩阵乘法的加速计算。
其他文献
利用激光诱导荧光(LIF)技术对HCCI光学发动机内甲醛进行了定量测量研究.Nd:YAG激光器的3倍频输出激光(355 nm)被用来激发甲醛(CH2O)的104能级,通过测量CH2O荧光信号推导CH2O
目的:贲门腺癌(gastric cardiac adenocarcinoma ,GCA)按1991年发布的中国贲门腺癌的界定标准,瘤体发生在胃体上端的齿状线以上的多为食管鳞状细胞癌,瘤体发生在齿状线下约2.
核仁磷酸蛋白(nucleophosmin,NPM1)基因突变是目前急性髓系白血病中突变率最高的基因改变,在白血病的发生发展中发挥重要调控作用。已有研究表明NPM1突变可以通过促进细胞增
资源紧缺下城市化建设要走可持续发展道路,且要针对现今严峻的生态环境,实现经济、绿色和生态的统一,保证城市建设的完整性和完善性,促进城市生态环境的改善和优化,做好'
目的(1)研究人胃癌BGC-823肿瘤细胞系中是否存在悬浮生长的肿瘤球,并检测ABCG2 (ATP-binding cassette superfamily G member 2)、前胃泌素(progastrin, Pro-GRP)、CD44、CD1
振兴乡村基础教育是地方师范院校的本质属性使然,也是地方师范院校凝练自身办学特色和优势,优化学科布局的要求。在市场经济和教育改革的大环境中,地方师范院校应从供给侧发
含元斋位于山东省青岛市,是一家集收藏、交流、展览、销售于一体的专业高档画廊,以经营吴悦石先生及近现代名家精品书画为主。含元斋不同于一般的传统式画廊和当代艺术画廊,
目的:滋养细胞疾病(gestational trophoblastic diseases,GTD)是一组来源于胎盘绒毛滋养细胞的疾病,根据组织学将其分为葡萄胎(hydatidiform mole,HM)、侵蚀性葡萄胎(invasiv
目的研制优质美观,严格消毒、灭菌包装,使用方便,可减轻患者痛苦的一次性使用灭菌穿耳钉。方法保护软管的中段设有两个缺口,中空的穿刺针从第二缺口插入保护软管的下半段,从
通过统计2005—2016年全国煤矿较大及以上安全生产事故,分析我国煤矿事故的灾害现状、发展趋势、地区差异及与主要经济指标的关联特征,这对于预防和治理煤矿灾害、保障矿工生