统一计算架构相关论文
针对复杂装配体在多指标需求下装配精度计算效率低下的问题,提出一种基于统一计算架构(CUDA)的多误差传递路径装配精度并行计算模型。......
分组密码由于在软硬件上实现便捷,常被用于数据加密及隐私保护。如何在大数据环境下,对分组密码进行高速实现,以提供安全支持,成为......
赫姆霍兹方程求解是GRAPES数值天气预报系统动力框架中的核心部分,可转换为大规模稀疏线性系统的求解问题,但受限于硬件资源和数据......
本文针对传统FDTD算法的不足,以图形加速器为核心,通过理论分析和数值模拟,研究并实现了基于CUDA平台的FDTD并行算法.CUDA是最新的......
归约算法在科学计算和图像等领域有着广泛应用,本文系统研究了在OpenCL 框架下,归约算法在 GPU上的跨平台性能优化.已有研究工作一......
合成孔径雷达(简称SAR)是一种全天时、全天候的高分辨率微波成像系统。极坐标格式算法(简称PFA)是一种适用于高分辨率、小场景的聚......
差异蛋白质点提取是蛋白质组学的重要研究方法之一,是凝胶图像分析的关键技术,能为药物研制、环境污染分析和疾病诊断提供重要依据......
密码分析的问题可以通过穷搜索或查表法解决。但是它们分别需要需要大量的时间与存储空间。进而,穷搜索与查表法存在比较大的局限......
机器学习是人工智能的核心,它使机器可以像人类一样变得“智能”,并且在保证获取新的“知识”的前提下,他会重新整合已有的“知识......
在等离子体平衡重建迭代过程中,我们需要快速求解Grad-Shafranov(G-S)方程。在目前的EAST等离子体平衡重建PEFIT代码中,采用五点差......
现代战争对雷达的自动化和智能化水平提出了较高的要求,以雷达目标识别为代表的智能信息处理技术受到了广泛的关注。随着雷达信号......
基于壳单元理论的有限元分析方法广泛应用于汽车车身的CAE分析,在本文中主要用于解决板壳结构的非线性问题和板料冲压成形的仿真计......
在形如中微子能谱分析中,因其本征能谱跨度较大,在积分描述所探测到的能谱时,探测器分辨率本身随能量的连续变化应该被考虑.对于该......
在等离子体平衡重建迭代过程中,我们需要快速求解Grad-Shafranov(G-S)方程。在目前的EAST等离子体平衡重建PEFIT代码中,采用五点差分......
在很多新兴应用领域、如传感器网络,实时监控系统等,产生的数据流是不断变化的、连续到达的、数据值可能不确定、且必须被快速处理。......
为了对任意长的明/密文进行并行加密/解密,在分析了AES(Advanced Encryption Standard)的多种模式后,采用了最合适的CTR(Counter)......
近几年图形处理器GPU的通用计算能力发展迅速,现在已经发展成为具有巨大并行运算能力的多核处理器,而CUDA架构的推出突破了传统GPU......
目的建立基于统一计算架构(CUDA)下以单幅X线图像及CT扫描数据为数据源的2D/3D配准系统,并应用于膝关节在体运动及植入假体稳定性......
在很多新兴应用领域、如传感器网络,实时监控系统等,产生的数据流是不断变化的、连续到达的、数据值可能不确定、且必须被快速处理......
针对SKINNY加密算法在中央处理器(CPU)下实现效率偏低的问题,提出一种基于图形处理器(GPU)的快速实现方法。首先,结合SKINNY算法的......
为了提升高维复杂非线性函数优化问题的求解效率,设计现了一种基于图形处理器的差分进化算法的细粒度并行计算方法。主要解决了GPU......
二维泊松方程离散化之后可以转化为一个具有特殊格式的块三对角方程的求解问题,通过对这一结构化线性方程组的研究,提出了一个适用于......
针对使用底层API进行GPU加速时存在的编码复杂以及效率低下等缺陷,文中试图利用基于中间层的OPENACC加速技术对传统的串行代码进行......
针对稀疏矩阵运算难以发挥图形处理器的强大运算能力的现状,基于图形处理器的统一计算架构,在线程映射、数据复用等方面研究了一系......
提出了一种实时全局光照的计算方法。该方法支持任意视点下动态光源的一次间接光照计算,并且物体表面材质可实时编辑,该算法预计算......
随着高性能计算需求的不断增长,人们开始将目光投向具有强大计算能力及高存储带宽的GPU设备.与擅长处理复杂性逻辑事务的CPU相比,G......
超声成像算法的仿真对于成像系统的研究和设计有重要的意义。我们在分析波束形成算法和图形处理器的并行性的基础上,以改进仿真速......
迫零线性预编码可以获得接近最优的系统容量,不同于传统MIMO系统,大规模MIMO将会配置成百根天线,随着天线数量增加,使得迫零线性预......
压缩感知重构算法存在计算量大、运行时间过长的问题,无法满足人们对算法处理实时/准实时性要求。最近几年,GPU计算能力得到很大的......
针对目前快速多极子算法中PP问题在图形处理器上实现的缺点,如负载不平衡和计算规模受显存大小的限制等,提出了一种新的基于统一计......
不变矩自提出以来被广泛应用于目标识别系统中进行特征描述,这需要能够实时计算不变矩值。虽然已经提出了许多不变矩的快速算法,但......
群体仿真中个体从环境中查找相关对象时会导致较高的时间复杂度。要使大规模群体能够实时仿真,必须降低模型运算的时间复杂度或者......
偏振参数成像技术,有别于传统的依赖于光强差成像的直观成像,在材料科学、遥感探测、生物医学、军事侦察等领域有着重要的应用,是......
针对海量空间科学数据的精细及实时三维绘制需求,提出并实现了一种基于CUDA语言的并行化光线投射体绘制加速算法,利用传统体绘制算......
在研究并行蚁群信息素交流方法的基础上,提出了一种适于GPU统一计算架构模型的多蚁群算法。采用多个同构和异构蚁群共享同一信息素......
针对传统视频清晰度评估方法实时性较差的问题,利用统一计算架构(CUDA)高度并行性的特点,提出一种基于CUDA的3G视频清晰度评估方法......
汽车车身结构接触碰撞过程有限元计算是汽车CAE的重要组成部分,主要涉及汽车碰撞和车身覆盖件成形等工程问题分析,在力学上涉及到材......
提出了一种新的人耳点云并行Softassign配准算法。在基于CUDA对Softassign算法进行并行加速的基础上,利用三维点云离散曲率估计和......
为提高图像处理领域协方差矩阵的计算效率,满足其在实时要求下的应用,借助GPU通用计算技术,结合CUDA编程模型,对协方差矩阵的计算......
针对快速傅里叶算法FFT在图形图像处理和科学计算领域的重要作用,提出了一种基于CUDA的高速FFT计算方法,在分析GPU硬件平台执行模......
针对目前基于CPU架构的软件GNSS中频信号模拟器计算能力有限,不能实时生成多通道数、高采样率信号的问题,在分析了软件模拟器的数学......
双目立体视觉是获得现实场景深度信息的一个重要手段,是计算机视觉领域一个备受关注的研究课题,在机器人视觉与自主导航,三维测量与三......
虽然图像采集设备的发展日新月异,分辨率和清晰度不断提高,但普通图像采集设备仍会出现散焦、运动模糊等问题。解决此类问题虽然可......
近年来,随着工业控制领域自动化和智能化的高速发展,对工业实时数据的处理和存储能力的要求也在逐渐提高。为了缓解在数据处理和存储......