搜索筛选:
搜索耗时1.8558秒,为你在为你在102,285,761篇论文里面共找到 22 篇相符的论文内容
类      型:
[期刊论文] 作者:张先轶,, 来源:软件和集成电路 年份:2019
澎峰科技是中科院的技术团队,做过国际知名的开源矩阵计算库OpenBLAS,获得过中国计算机学会科技进步二等奖、中国科学院杰出科技成就奖,是国家高新技术企业、中关村高科技企...
[学位论文] 作者:张先轶, 来源:中国科学院大学 年份:2014
[会议论文] 作者:张先轶, 来源:BDTC2016中国大数据技术大会 年份:2016
[会议论文] 作者:张常有,张先轶, 来源:第六届R语言会议——北京会场 年份:2013
[期刊论文] 作者:陈家杰,李会元,张先轶,, 来源:数值计算与计算机应用 年份:2012
本文研究六边形区域上快速傅里叶变换(FFTH)的CUDA-MPI算法及其实现.首先,我们通过充分利用CUDA的层次化并行机制及其库函数,设计了FFTH的高效率的CUDA算法.对于规模为3×2048~2的双精度复数类型数据,我们设计的CUDA程序与CPU串行程序相比可以达到12倍加速比,如......
[会议论文] 作者:张先轶,王茜,张云泉, 来源:2011年全国高性能计算学术年会(HPC china2011) 年份:2011
  BLAS是科学计算中最基础的数学库之一,各CPU厂商都推出了针对各自CPU的优化的BLAS库。龙芯CPU是中科院计算所自主研制的通用CPU,目前已推出了龙芯3号系列。本文介绍了我们...
[期刊论文] 作者:程豪, 张云泉, 张先轶, 李玉成,, 来源:计算机工程 年份:2010
实现ATI平台上的CPU-GPU混合并行DGEMM,采用在GPU和CPU上同时进行计算的方法来提高运算性能。实验结果证明,当矩阵规模较大时,在AMD Phenom II X4 940和ATI FireStream 9270...
[会议论文] 作者:袁良,张云泉,王可,张先轶, 来源:2010年全国高性能计算学术年会(HPC china2010) 年份:2010
  近年来在生物计算,科学计算等领域成功地应用了GPU 加速计算并获得了较高加速比.然而在GPU 上 编程和调优过程非常繁琐,为此,研究人员提出了许多提高编程效率的编程模型和编......
[期刊论文] 作者:张先轶,李刚,韩德飞,王云川,, 来源:冶金标准化与质量 年份:2010
永钢立足现有工艺装备,通过调整化学成分,明确转炉冶炼、LF精炼、连铸和高线轧制等过程的质量控制点,成功生产出SWRCH35K冷镦钢盘条。结合永钢SWRCH35K的开发经验,分析了该钢...
[期刊论文] 作者:王磊,张云泉,刘芳芳,张先轶, 来源:计算机工程 年份:2010
利用求解线性方程组的混合精度算法,对HPL软件包进行改进。从性能与加速比、迭代时间与迭代次数以及误差分析3个方面,在四路AMD Opteron870双核处理器平台上,对原HPL与改进的...
[期刊论文] 作者:胡泽林,张云泉,王靖,张先轶, 来源:计算机工程与科学 年份:2009
本文设计并实现了基于质谱的非标记定量软件QuantWiz,通过改变肽段定量的顺序,提高了定量软件的时间局部性和质谱数据缓存的命中次数。分析了QuantWiz的多种数据并行策略,设计并......
[期刊论文] 作者:李长胜,马志军,王进,张先轶,, 来源:山东冶金 年份:2014
对82B线材控轧控冷工艺进行了优化,通过改变终轧温度、吐丝温度和斯太尔摩辊道速度及冷却工艺参数,盘条的组织和力学性能基本达到了使用要求,索氏体化率达到85%以上,月产量稳定在......
[期刊论文] 作者:巩庆奎,张常有,张先轶,张云泉, 来源:计算机科学 年份:2015
Julia语言是一种在MIT许可证下免费的开发中脚本语言(beta 0.2.0),目标是降低并行程序的编程难度.基于Julia现有语法机制,逐步增强Julia语法特性,结合公交线路的平均走行时间统...
[期刊论文] 作者:刘益群,李焱,张云泉,张先轶, 来源:计算机科学技术学报(英文版) 年份:2014
Equipped with 512-bit wide SIMD instructions and large numbers of computing cores, the emerging x86-based Intelr Many Integrated Core (MIC) Architecture provide...
[会议论文] 作者:张先轶[1]王茜[2]张云泉[2], 来源:2011年全国高性能计算学术年会(HPC china2011) 年份:2011
  BLAS是科学计算中最基础的数学库之一,各CPU厂商都推出了针对各自CPU的优化的BLAS库。龙芯CPU是中科院计算所自主研制的通用CPU,目前已推出了龙芯3号系列。本文介绍了我们...
[期刊论文] 作者:刘益群,李焱,张云泉,张先轶,, 来源:Journal of Computer Science and Technology 年份:2014
Equipped with 512-bit wide SIMD instructions and large numbers of computing cores,the emerging x86-based Intel Many Integrated Core(MIC) Architecture provides...
[期刊论文] 作者:刘益群, 李焱, 张云泉, 张先轶, 来源:null 年份:2014
[会议论文] 作者:陈少虎,张云泉,张先轶,程豪, 来源:2010年全国高性能计算学术年会(HPC china2010) 年份:2010
BLAS 库是高性能计算中最基本的数学库,它的性能对超级计算机的性能有着极大的影响.而且随着CPU多核化的发展,BLAS的多核并行性能已经变得比与体系结构相关的单核性能更加重要.实验以流行于高性能计算的Xeon、Opteron 系列多核X86 处理器为例,全面测试了GotoBLA......
[会议论文] 作者:陈少虎[1]张云泉[2]张先轶[3]程豪[1], 来源:2010年全国高性能计算学术年会(HPC china2010) 年份:2010
  BLAS 库是高性能计算中最基本的数学库,它的性能对超级计算机的性能有着极大的影响.而且随着CPU多核化的发展,BLAS的多核并行性能已经变得比与体系结构相关的单核性能更...
[会议论文] 作者:陈华斌,张先轶,王云川,符光常,庄清玉, 来源:2012年全国高强度钢筋开发与应用推广技术及市场交流会 年份:2012
分析了φ50mmHRB500E高强抗震钢筋的技术要求,通过化学成分和生产工艺的优化设计,实现了φ50mmHRB500E高强抗震钢筋的顺利生产,产品达到了GB1499.2-2007的要求.永钢通过几年...
相关搜索: