CPU-GPU异构计算环境下的Cube CNN模型设计与应用研究

来源 :南开大学 | 被引量 : 0次 | 上传用户:rocxdp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
高光谱图像分类是遥感领域的研究热点之一。随着光谱信息的不断丰富和光谱波段数的迅速增加,传统分类器如支持向量机、随机森林等,在处理高光谱分类应用时,往往由于输入数据的维度高而遭遇性能瓶颈。近年来,深度学习方法发展迅速,深度卷积神经网络(CNN)能够有效地从原始图像中提取具有代表性的特征,因此在图像分类领域应用广泛。由于高光谱图像分类是像素级别分类,因此,设计专用于高光谱图像分类应用的深度CNN网络,一直是高光谱图像分类领域研究的关键。图形处理器(Graphic Processing Unit,GPU)作为最通用的加速芯片之一,被广泛应用于高性能计算领域。由于深度神经网络的训练耗时严重,越来越多的研究人员致力于将GPU应用于深度学习领域,以加速模型的训练过程。本文将高光谱图像近邻像素策略与CNN相结合,提出一种面向高光谱图像分类应用的Cube CNN模型。针对该模型的训练特点,提出基于GPU平台的GCN并行加速框架:首先,本文为GCN框架设计了一种高光谱图像数据集预处理算法——PNPE(Parallel Neighbor Pixel Extraction)算法,该算法能够并行地从原始高光谱图像数据集中提取样本并保存在GPU的Global Memory中,用于后续模型的训练。其次,结合Cube CNN各层的数据运算特点和GPU的软硬件体系结构特点,本文在GCN框架中引入了Cube CNN-To-GPU的映射机制,该机制能够将Cube CNN各层的训练映射到GPU端的CUDA kernel,为模型训练的GPU并行加速奠定基础。最后,本文设计了GPU端具体的数据存储模式和同步机制,并将Multiple CUDA Streams技术与小批量梯度下降(MBGD)算法相结合,进一步提高了该算法的执行效率。实验证明,在保证Cube CNN模型精度的前提下,GCN框架能有效提升模型的训练速度,与常用并行加速平台Caffe和Theano相比,最多分别能缩短85%+和90%+的模型训练时间。最后,本文通过设计跨平台GPU上的模型训练时间对比实验,验证了GCN框架具有良好的可移植性。
其他文献
中华人民共和国成立70年来,我国中学物理教学研究历经三个阶段的演变:初期的理论移植与经验积累,转型期的思想流变与实践改革以及新课改后的理论繁荣与方法创新。纵观发展历
<正>在场的工人,缺席的主体。在电影史上,工人作为一个阶级几乎消逝了。从《摩登时代》到"血汗工厂",卓别林的背影并没有走多远1918年,英国的"喜剧之王"查理·卓别林来到了好
目的探讨联合肝叶切除治疗肝门部胆管癌的疗效,并探讨肝门部胆管癌预后的影响因素。方法回顾性分析1996.1至2009.6福建医科大学附属协和医院外科收治64例并手术切除治疗的肝
采用银氨溶液原位还原法制备稳定、抗菌性持久的蚕丝织物。探讨了银氨溶液浓度、反应温度、处理时间等因素对银负载量的影响,并与AgNO3溶液处理蚕丝织物作了比较,测试了含银
为了研究人工合成红景天苷(salidroside,Sal)对脂多糖(lipopolysaccharide,LPS)诱导大鼠急性肺损伤(acute lung injury,ALI)的保护作用及其机制,将雄性Sprague-Dawley大鼠随
通过样方分析与核密度估算揭示了都江堰市耕地时空演变特征,采用景观格局指数法分析了都江堰市耕地破碎化趋势变化,最后探究了耕地破碎度和人工干扰度之间的关系.结果表明:都
辑评十多年前,国学大家冯其庸先生在发表于《中国文化报》的评论中写到:读刘老的画,真有“如听仙乐耳暂明”的感觉。其所以如此,是因为刘老的画,是地道的中国气派、中闺神韵!笔墨
<正> 根据法院组织法第11条规定,审判委员会的任务是总结审判经验,讨论重大的或疑难的案件和其他有关审判工作的问题。作为人民法院内部的集体领导组织,总结审判经验,讨论与
建立了一套采用动力计算法、以船舶自动识别系统(AIS)数据为基础,利用船舶逐条动态上报信息自下而上编制船舶大气污染物网格化排放清单的方法,尤其是针对AIS静态信息不足以支
近几年来随着智能手机的普及,出现了各种移动端的业务,在能源革命、“互联网+”和创新驱动等国家战略的背景下,能源互联网将成为能源领域创新创业的沃土,为了更好的向用户展