GPU优化的大规模线性方程组并行求解的研究与比较

来源 :信息通信 | 被引量 : 0次 | 上传用户:hualidewushi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
采用CUDA平台提供的通用并行处理架构,在Gauss-Jordan消去法的基础上,给出了一种适合CUDA平台的并行算法来进行大规模线性方程组的加速求解。算法在GPU端进行整体线性方程组的求解,从Device传回的为方程组的解向量,大大减少了来自Host端和Device端数据传输所带来的延时。算法对任务划分及处理进行了充分的分析。在耗时最为严重的消去阶段,通过增加单个线程的算术逻辑运算来减少线程块之间切换带来的整体算法耗时,并对算法的其余每个阶段都进行了充分的优化。最后在本机上进行了不同线性方程组维数的并行
其他文献
文章介绍了软件无线电相关技术特点,提出了一个具有开放的、标准化的、模块化的通用硬件平台架构,以及一个合理软件通信体系结构,采用VxWorks操作系统作为嵌入式RTOS,充分利
随着航天航空技术的不断发展,DVOR导航设备系统在我国的航天航空的各个领域开始广泛应用,近些年来特别是在我国的民航中DVOR得到了普遍的利用。文章主要介绍了DVOR导航设备在
民航报文的自动存储与转发,是整个空管系统所依托的通讯基础,其运行的稳定性关系到整个民航飞行安全。DMHS-H具有报文处理能力强,硬件、网络高度冗余等特点,是目前国内空管核
信息的直观性是非常强的,而且信息要具有可靠性,是人类传递各类知识的关键载体,随着信息技术的发展,视频系统在人们的生活和工作中应用越来越广泛,如电话会议等,这些技术能够实现信息的实时传递,能够将信息及时的传递。在图像采集的过程中,一般都是采用计算机,但是计算机系统的面积大,而且要花费很多的资金,计算机要在有网络的地方才能够传递信息。随着通讯技术的发展,无线网络在人们的生活中广泛应用,运用DSP+FP
本文以项目教学法为引领,立足高职院校专业人才培养目标,围绕电气自动化技术专业的《PLC应用技术》教学目标,以自动分拣线控制系统为载体,进行课程内容的整合,进而撰写项目任
EC风机具有改变出风速度、改善风道送风沿途阻力问题,实现精准送风的特点,目前已得到了广泛应用。事实上,通过风机节能改造,能够在很大程度上提升风机效率,较低风机能耗。基
近年来,移动通信网络格局发生着重大变化,尤其以CSFB为代表4G语音方案的实施,使得网络复杂性进一步提高。传统的网络优化与故障定位模式,很难聚集重点、实施用户投诉的追本溯源。针对早期模式中的不足,开发出一种基于多维数据的CSFB端到端分析系统。依托于数据共享平台,具备CSFB全局指标概览、全流程呼损分析、重点问题多维关联分析与二次定界、重点KPI报表输出等功能,对CSFB网络质量进行闭环管理和全流
卡号是运营商的珍贵资源,提升放号能力即是提高资源利用率。套卡放号模式因其制卡周期长、库存要求高、管理成本高等,对号码利用率的提升存在很大制约,广东移动通过新型卡体
气体识别关键技术是对气体进行检测的一种技术手段,通过模拟生物嗅觉功能,能够保证气体检测具有较高的效率性和准确性。气体识别技术在公共安全检测、食品质量控制、环境保护
为了探析计算机图像处理技术在医学中的运用,首先对医学图像处理技术进行了简要的概述,其后论述了计算机处理技术在中医舌像、超声成像、医学影像、图像外引导医学手术以及皮肤病诊断中的应用,最后对计算机图像处理技术的应用前景进行了分析。