CUDA-CONVNET深层卷积神经网络算法的一种速度优化

来源 :北京工业大学 | 被引量 : 0次 | 上传用户:PLF119
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深层卷积神经网络是人工神经网络在图像识别领域的一个研究热点,其目的是通过多层的网络结构进行复杂特征的提取并给出图像所属类别等属性。cuda-convnet深层卷积神经网络算法在处理批量图像时速度较快,但是在实际应用中,往往需要对一幅给定的图像进行识别测试,这就导致算法的效率不高。因此,在深入理解cuda-convnet深层卷积神经网络算法的基础上,本文提出了一种新的算法,对原有算法进行了速度优化。  本文首先阐述了cuda-convnet算法的卷积操作,指出了它存在的问题,然后提出了新的并行算法---特征图与像素并行算法。在该算法中,图像被分割为与卷积核大小相同的若干模块,在特征图与像素并行方向,线程块内的每个线程完成卷积核通道中的若干像素对图像对应特征图中一个模块的对应像素的卷积,那么若干线程的卷积结果的加和就是卷积核对一幅图像的一个模块的卷积。在卷积核并行方向,依次完成所有卷积核对一幅图像的一个模块的卷积,然后再遍历图像的所有模块,即完成了所有卷积核对一幅图像的所有模块的卷积,卷积得到的图像具有与卷积核数量相同的特征图。最后,通过实验分别测试各个卷积层的卷积用时和整幅图像用时,其中,本文提出的算法的整幅图像用时为2.2ms,相比cuda-convnet算法其速度提高了6倍,具有一定的应用价值。
其他文献
网格从最开始的理论设想发展到现在的具体应用,它的内涵经历了不断的演化和变迁。最早是“电网”比喻,像用电一样来使用网格资源,不管是火电还是水电,不管生产经过了什么样的工序
学位
模态逻辑是逻辑学中的一个重要的分支,它是自然语言中有关模态部分的数理模型.目前,模态逻辑已经被广泛用于人工智能的知识表示以及计算机科学的其他领域. 信念逻辑是一类
交换结构和调度算法的性能分析是交换机研究中的核心问题.在理论分析和仿真实验这两种分析方法中,仿真实验因具有良好的可操作性而被广泛使用.传统仿真方法基于个别流量负载
随着2D图像通信系统应用越来越广泛,具有立体感和可交互性的自由视点视频系统(FVV,Free Viewpoint Video)逐渐成为下一代多媒体系统的研究目标.本文探讨的自由视点视频系统采
由于并行传输电路在高速传输方面的不足,串行传输技术得到了迅猛发展,中科院计算所曙光5000高性能计算机的交换芯片就采用了这一技术以满足芯片间的高速通信需求.对于高速串
机群系统以良好的可扩展性、可用性、可靠性和性能价格比占据着高性能计算机领域的主导地位.大规模的机群系统由于节点量大存在诸多问题,如管理的复杂程度高、可靠性降低、整
目前,数据挖掘的理论和技术蓬勃发展,以缓解由数据库技术的普及带来的"数据过剩而知识匮乏"的问题.数据挖掘不仅已成为生物信息、计算化学、地理信息等科学领域的重要研究手
随着互联网的普及和发展,各种新兴的Internet业务不断涌现,占用越来越多的网络资源,致使网络流量激增,网络常常表现出容量不足.因此,网络管理和维护人员有必要及时了解网络容
随着计算机的应用日益增多,各行业对软件系统的健壮性和稳定性提出了更高的要求,使得软件测试在整个软件项目中的地位日益重要。基于FSM模型的系统测试是一致性测试的重要研
本文的主要背景是中国科学院“十五”信息化建设重大项目—科学数据库及其应用系统。科学数据库经过二十多年的发展,积累了大量的科学数据资源,如何对这些分布、异构的数据资源
学位