GPU计算相关论文
该文针对神经网络模型训练过慢、集群部署缺乏弹性问题,采用CPU+GPU混合架构,利用Docker和Kubernetes系统搭建底层容器云基础,以Tenso......
对语音增强的方法研究开始于20世纪70年代,目前形成了4大类传统的语音增强方法,包括谐波增强法、谱减法、基于语音生成模型的算法......
随着智能计算和大数据应用的发展,人们对GPU等加速部件的需求不断增长.计算软件栈比如CUDA、OpenCL软件栈是能充分发挥GPU硬件性能......
本文根据页岩气流动特点建立了考虑混合气体高压物性参数,渗透率与孔隙度随压力变化的页岩气流动方程,通过定义拟压力函数将页岩气......
近年来基于GPU的并行技术发展迅猛,许多计算量很大的应用通过GPU并行计算获得了近百倍的加速比。然而,GPU的异构并行在内存管......
未来多个卫星导航系统组成的全球导航卫星系统将为全球民用导航用户提供更多选择。正是由于多种卫星导航定位系统的出现和发展,GNSS......
体绘制技术是一种基于光学发射和吸收模型的科学可视化技术,近些年经历了快速发展,并且得到了广泛的应用。光线投射算法是目前绘制质......
当前,由于生物学研究中DNA测序技术的革命性突破,使得高通量测序技术的应用越来越广泛。作为下一代测序技术,高通量测序以其低成本,高......
虚拟植物生长(植物生长建模)研究是伴随着计算机科学、仿真科学及农林业科学等多个领域的发展而产生的一门交叉性学科。其主要研究......
与计算机相比,人眼属于高度进化的生物视觉系统,而视觉信号又是人类获取周边环境信息的最主要和最直观的来源,现实生活中80%以上的......
由于DNA测序技术价格下降,已经产生了大量的分子数据,使其在育种工作中利用密集的全基因组标记图谱在经济上变得越来越可行.同时,......
研究高性能计算是为了计算模拟时间的缩短,并在有限的时间内增加试验次数,以促进包括工程学在内的其他各个领域的发展。相场法(Pha......
在很多计算密集的应用中,Stencil算法(模板计算)是耗时最多和最为重要的计算核心。随着GPU通用计算加速卡出色的计算能力、功耗控......
以变桁架式机械臂(VGT)为代表的超冗余度机械臂为一种太空空间站理想构型机械臂,有容错性强,载荷大等优势,而其路径规划问题中的逆......
冰川和冰盖演化数值模拟是全球气候演化数值模拟中的重要组成部分。随着模拟规模的扩大,计算规模的急速增长成为不可回避的现实。......
烟雾模拟技术在计算机图形学领域并不是一个陌生的话题。早在上个世纪八十年代已经开始有学者研究利用计算机技术实现烟雾模拟,如......
全球领先的边缘计算解决方案提供商—凌华科技推出首款搭载恩智浦半导体新一代i.MX 8M Plus SoC的SMARC 2.1版AI模块(AI-on-Module......
载波干涉再现技术是光学干涉技术结合计算机通用计算的光学分析重要技术之一。常规的方法是将待处理目标用光学CCD镜头采集,并利用......
LS-SVM(Least Square Support Vector Machine)算法作为一种机器学习算法,具有模型简单、学习能力强等优点,广泛的应用于包括时间序列......
基于体积分数的可压缩多相流模型是数值模拟多介质流和多相流问题的一种重要方法,它舍弃了界面变化的细节,只用体积分数的大梯度来......
GPU计算已经成为一种趋势,它可利用GPU原本用于图形处理的计算性能来协助增强CPU处理一些在GPU架构下更为高效的特定应用,不仅能让......
双线性插值算法在数字图像处理中有广泛的应用,但计算速度慢.为提高其计算速度,提出一种基于图形处理器加速的双线性插值并行算法.......
通过建立映射变换函数来改进基于最小自由能的RNA二级结构预测计算模型,分析证明了改进后的计算模型与原计算模型的等价性,利用改......
随着云计算技术的兴起和人们对隐私问题的日益关注,许多新兴的应用场景,如外包计算、云存储、安全多方计算等,都对同态密码有迫切......
针对目前基于普通DSP的FIR算法速度低、扩展性差的缺点,提出并实现基于CUDA平台实现的FIR滤波算法。由于在CUDA中程序可以直接操作......
本文将计算流体力学中的可压缩的纳维叶-斯托克斯(Navier-Stokes),不可压缩的Navier-Stokes和欧拉(Euler)方程移植到NVIDIA GPU上......
各类P系统并行计算的实现是膜计算的一个研究热点。针对耗尽型脉冲神经P系统,提出了其并行计算的矩阵表示,并以此为基础研究了耗尽......
使用ff12SB力场和广义玻恩(GB-Neck2)隐性水模型在GTX670 GPU上对4个蛋白质CLN025 (2ZEI)、MHA6(2I9M)、Trp-Cage (1L2Y)、Villin (3TRW)的微......
ARM公司宣布。为各类商用到家用智能设备提供先进图形计算和用户使用体验的Mali图形处理器技术获得了巨大成功。这一成长主要归功......
随着计算机网络的不断发展以及人们对网络性能要求的不断提高,现有网络很难满足人们的需要。Open Flow的出现能够很好地解决现有网......
受限于计算能力,在现有的电热分析研究中,无法考虑电压变化对电热分析的影响,从而降低了分析的精度.基于已有的研究成果,文中分析......
为了进一步提高叠前时间体偏移的计算效率,实现了在GPU\CPU协同并行计算模式下Kirchhoff叠前时间体偏移技术,并进行优化。经在Nvida T......
提出一种基于图形处理器(GPU)的对称正定稀疏矩阵复线性方程组迭代算法.首先,采用基于GPU的共轭梯度法和双共轭梯度法,实现GPU上的矩......
依据现代GPU在通用计算方面的功能,提出了基于Brook在GPU上执行通用计算的实现方法,运用图像分割、快速傅立叶算法和光线跟踪3个应......
提出一种大规模声学边界元法的高效率、高精度GPU并行计算方法.基于Burton-Miller边界积分方程,推导适于GPU的并行计算格式并实现......
随着地球物理对高性能计算需求的不断提升,集群系统节点规模不断提高,一方面大大提高了系统建设、运行、维护、管理及应用软件开发的......
由于GPU(图形处理芯片)拥有强大的通用计算能力,在地球物理领域进行GPU计算的应用研究日益受到关注。基于CUDA软件开发环境,根据裂步法......
随着图形处理器通用计算的发展,GPU(graphics processing unit)通用计算程序功耗的度量与优化成为绿色计算领域中的一个基础问题.......
蚁群算法与同类智能算法相比具有计算速度快、收敛迅速、算法稳定性好等优点,但是随着数据量的增大,计算用时呈现指数型增长。为了更......
利用格子Boltzmann方法和GPU计算技术,在孔隙尺度上模拟多孔介质中包含界面化学反应的粘性指进现象,定量分析化学反应对流体混合的......
提出了使用廉价的图形卡来实现基于SOM的图像处理算法,达到检测产品瑕疵的目的.算法基于GPU的fragment shader程序,并使用了最新出......
利用非专业图形卡来实现批量式自组织映射(batch version of the SOM)的学习过程.算法基于OpenGL的扩充规范NV_fragment_program,......
针对GPU特别适合于矢量并行计算这一特点,提出了一类新的基于预估—校正策略的暂态稳定快速仿真方法。该方法首先采用Taylor级数法......
目的研究改进现有指纹自动识别系统的比对速度。方法将大量的比对数据提前加载到内存中,结合多线程并行计算,达到一次加载多次使用......
依据各级缓存容量,将CPU主存中种群个体和蚂蚁个体数据划分存储到一级、二级和三级缓存中,以减少并行计算过程中数据在各级存储之......
在生物信息学中,数据库序列比对是极为常用的操作,Smith—Waterman算法是最流行的序列比对算法,精确度高,但是计算复杂度高,在进行大量......
利用计算机绘制可信的虚拟毛发画面一直是计算机图形学中重要的基础部分。它被广泛的应用在影视与游戏中,但是由于毛发数量非常巨......
基于GPU,对声学Burton-Miller积分方程的边界元解法进行并行计算.提出并行计算格式和程序实现方法,以及Burton-Miller方程中各类奇......