数据并行相关论文
随着机器学习领域的不断发展,用于机器学习的模型变得越来越大,用于训练的样本数据量不断增多。这两种变化导致了单台计算机在执行......
深度神经网络(Deep Neural Network,DNN)并行化已成为高性能计算领域一个热点问题,也是解决大规模模型训练缓慢的最佳方法之一。然而......
针对深度学习图像分类场景多GPU并行后传输效率低下的问题,首先提出一种时间复杂度更低的Ring All Reduce改进算法,通过分节点间隔配......
随着人工智能的飞速发展,机器学习逐渐趋向于大数据、大模型、大规模集群训练,这在加强机器学习能力的同时也对机器学习策略提出了......
随着机器学习算法模型规模和数据量的高速增长,单个节点不能够有效的承担大规模训练所需的计算和存储需求,因此在分布式集群中运行......
聚类是数据挖掘领域中的一个重要研究课题。随着聚类分析对象数据集规模的急剧增大,改进已有的算法以获得满意的效率受到越来越多的......
流体系结构是近年来提出的一种源于媒体处理的高性能体系结构。这种结构针对流媒体应用的计算、访存和通信特征,采用大规模的运算阵......
SIFT(Scale Invariant Feature Transform)特征在物体检测和识别、图像配准与融合、纹理识别、场景分类、人脸检测、图像检索、三......
目的:系统评价低分子肝素(low molecular weight heparin,LMWP)治疗急性胰腺炎(acute pancreatitis,AP)临床疗效。方法:计算机检索......
内存不足是蒙特卡罗方法大规模输运模拟的关键问题。对于反应堆燃耗分析,需在输运过程中统计大量反应截面数据,计算机内存限制了燃......
[目的]本文主要就大数据基础理论及系统相关研究背景、技术架构和关键技术展开介绍,并结合技术发展趋势提出未来研究和技术发展方......
数据并行计算在气象、地质、国防等重大领域中发挥着重要作用,进行数据并行计算的研究,对于提高我国综合国力有着非常重要的意义。本......
为了评估数据并行(DLP)应用并行化后在GPU体系结构上的执行性能,针对OpenCL架构提出一种GPGPU量化性能模型.该模型充分考虑了影响G......
针对异步随机梯度下降算法在多核系统和主/从集群环境中的通信冲突问题,提出了异步双随机梯度下降算法.该算法主要通过离散各从节点在......
HPF(high performance Fortran)是一种典型的数据并行语言,HPF编译系统的实现是并行计算研究领域的一个难点.文章介绍了一个HPF编......
在分析MPP结构的基础上,探讨了适宜MPP的消息传递方式的两种并行程序设计方法,介绍了数据并行程序设计方法应注意的问题,以及并行......
针对并行训练算法面临的诸多问题上,提出了一种并行分布式训练模型.该模型采用主一从机结构,通过数据片split迭代得到数据块block,......
深度学习并行化在加速模型训练、提高预测精度等方面具有重要作用。文章从数据并行、梯度累积算法两方面对深度交通时间预测模型(T......
从应用的角度建立了评价大规模问题数据并行处理性能的模型,分析了区域的不同划分对解整个问题算法的收敛速度有影响时的并行性能,......
随着数据并行应用需求的日益增长,可任意划分负载的调度问题已经成为并行调度领域新的研究热点。回顾了可任意划分负载调度的基本......
为了充分利用多核处理器提供的多级并行和解决多核资源分配问题,提出了一种将多任务并行程序映射到多核处理器平台上的模型驱动的方......
序列模式发现在数据挖掘领域中的地位越来越重要,本文首先介绍了频繁序列挖掘模式的基本概念,然后基于投影树算法,给出了其数据并......
本文的目的就是通过理论分析和试验,探讨集群环境下并行聚类算法的设计思想。作为一种低成本、通用并行系统,集群系统的通讯能力相对......
面向大规模数据进行知识约简是近年来粗糙集理论研究热点。经典的知识约简算法是一次性将小数据集装入单机主存中进行约简,无法处......
很多现实中的负载可分应用通常要求划分是有重叠的或者需要额外的附加信息.文章通过引入上述因素而对经典的DLS-3模型进行了扩展,......
数据并行训练神经语言模型,旨在不改变网络结构的同时,大幅度降低训练所带来的时间消耗。但由于多设备之间频繁的数据传输,使得整......
同步控制是并行执行中的主要开销源之一.本文以Fortran77串行程序自动转换为MPPFortran并行程序为背景,提出了一种减少数据并行程序......
文章研究需要控制信息的负载可任意划分应用的调度问题.控制信息是除了要处理的负载之外为了完成计算所必须的辅助信息,它的规模往......
针对多态同构阵列处理器,提出一种图形算法并行化的实现方法。该方法通过分析图形流水线中渲染算法的控制依赖、数据依赖关系,并对......
几何操作是计算机图形和计算机视觉的基本操作之一.如何快速、实时实现几何操作,是现代媒体应用中的一个重要问题.提出了一种几何......
文章主要讨论了LSSIMD计算机中所采用的并行技术 :数据并行技术、三级指令流水线并行技术与三组指令并行执行技术。......
基于局部线性滤波函数的大多数图像处理操作,都可以表示成图像数据与一个权值样板的卷积。对于N×N的图像M×M(M<N)的模板,......
本文在分析并行图像处理常用方法的基础上,针对全自动贴片机视觉系统对图像处理要求,对矩形片式元器件(Chip芯片)和IC芯片图像并行......
动态负载平衡问题是影响工作站网络并行计算性能的重要因素.首先分析出在负载平衡中产生额外开销的根本原因是负载的移动,进而定性......
为了进一步提高数据并行应用在星型网络上的运行性能,基于多次数据分配策略提出了一种调度算法.在该算法中一个处理器将输入数据和......
几何操作是计算机图形和计算机视觉的基本操作之一。如何快速、实时地实现几何操作,是现代媒体应用中的主要问题。重采样操作是图......
分析网络协议并行实现的必要性,探讨端系统与互连设备并行协议系统的实现体系结构的开发途径。......
针对SIMD计算机上的数字图像的几何变换问题,提出了一个新颖的基于阵列平移的数据并行实现方法。在此基础上,给出了数字图像几何变......
主要研究卷积计算的数据并行方法在MCC-SMD计算机的设计和实现问题.在参考国内外现有资料的基础上,从图论的角度用卷积路径的方法......
探讨在集群环境下,如何设计并行聚类算法.作为一种低成本、通用并行系统,集群系统的通信能力,相对于节点的计算能力,是一个瓶颈.所......
文中首先分析了地震资料并行处理的必要性 ,在介绍HPF高性能并行语言的特点后 ,着重讨论了p—HPF编译系统的体系结构与关键技术。......
作为一种新兴的计算模式,云计算受到了学术界和产业界的广泛关注.云计算以互联网服务和应用为中心,服务提供者需要存储和分析海量......
p_HPF是一个基于cluster体系结构的HPF并行编译系统,它不仅支持数据并行计算范例,而且也支持任务并行范例。给出了p_HPF并行编译系统......
提出一种适用于图形和图像处理的高效并行阵列机结构。该结构的处理单元有单指令多数据(SIMD)和多指令多数据(MIMD)两种运行模式,......
在生产领域的添加剂,数据处理的当前的研究主要集中于大 STL 文件或复杂 CAD 模型的切的进程。改进效率并且减少切的时间,一个平行算......
提高数据处理的规模与效率是模块化可视化环境目前需要解决的一个主要问题,提出了基于数据分解与组合的模块间数据并行与流水线处理......