基于GPDSP向量处理的深度学习算法的优化实现

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:TSNT1234
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
深度学习算法的迅猛发展,使得基于卷积神经网络的目标识别技术和目标检测算法在图像识别、图像分割等领域有了广泛的使用。将神经网络算法于应用在各种实时的环境中也是学术界和工业界关注的问题。通常神经网络算法计算量巨大,如何对算法进行高效的优化并满足实时性要求是研究的热点,与此同时,寻找和研制合适的硬件平台以便于更好的支持深度学习的算法的需求变得越来越迫切。因为算法计算量巨大,深度学习算法的实际应用需要依赖高性能的计算平台。本课题所用计算平台为FT 2000B GPDSP,是本课题组自研的一类国产化的向量处理器,本文所完成的工作主要有如下三点:探究如何在GPDSP上进行深度学习算法的映射,在向量处理器上进行卷积、池化、归一化等深度学习算法的典型层的计算,用向量化的方法将算法高效的映射到处理器上;根据映射方法研究所得出的结论,在FT向量处理器上进行深度学习算法AlexNet、YOLO的实现,并将摄像头与GPDSP连接起来,使其能对实时抓取的图像进行处理,搭建一个完整的系统;针对处理器的体系结构、深度学习算法的特点,挖掘计算中的并行性,进一步提高处理器利用率,在映射方法、编程语言、算法等各个方面对在GPDSP上实现的应用进行优化。在未来的工作中,我们将进一步改进GPDSP的结构,使其能为深度学习算法、神经网络结构提供更好的支持。并针对通用的卷积神经网络,开发标准的卷积库,使的在以后的研究和使用中,可以更加方便调用、快速实现、简化操作,能将其更好的推广。
其他文献
垂直领域客服机器人在服务的过程中经常遇到需要拒绝识别的场景,指的是机器人由于知识库局限不能正确回答的情况。相比“答非所问”,客服机器人拒绝识别再转由人工接手更能获
设施布局是对给定的设备确定合理有效的布局方式,具有实用性和多学科交叉性特征。设施布局优劣直接影响生产系统的物流成本和生产效率,对于现代制造企业具有重大意义。本文研
矿石在进行分选的过程中,为了实现将简单矿中的有用矿物与脉石在视觉范围内直观区分开,以达到提高选矿效率的目的,探索设计采用双能X射线透射物质识别技术应用于选矿方面,并
食管鳞状细胞癌(Esophageal Squamous Cell Carcinoma,ESCC)简称食管鳞癌,是一种发病率较高的癌症,中国更是食管鳞癌多发国家。现阶段食管鳞癌己经成为我国居民死亡的主要原
半绝缘GaAs非线性模式(Lock-on模式)可以由激光触发,也可以通过电子束注入触发。在GaAs光电导开关中,非线性模式能够带来极大的电流增益,大幅降低对触发激光单脉冲能量的需求
Ambisonics是一种分解与重构空间声场的方式,它通常被认为是由Blumlein拾音制式和M/S拾音制式发展而来的。这项技术由英国工程师Michael Anthony Gerzon在20世纪70年代提出,
由于白光LED具有节能环保、抗震动能力强、响应速度快、寿命长等优点,使得白光LED将成为继白炽灯、荧光灯和高强度放电灯后的第四代照明系统,也将成为21世纪重要的绿色照明光
随着机器人技术和仿生学的发展,学者对仿生机器人的研究越来越重视。而在仿生机器人的研究过程中,关节作为其滑动转动及摆动的关键部件,因灵活、紧凑、运动范围大、刚度较高
随着互联网在现代生活中的普及,现实世界中的许多事物都以网络的形态存在,重叠社区发现算法可以帮助我们更好地理解网络的结构特征。目前重叠社区发现算法总体可以分为全局划分和局部扩展两大类。本文主要对局部扩展类的重叠社区发现算法进行研究,针对现有算法在划分结果的准确性、稳定性和算法运行时间等方面存在的一些不足进行研究,提出多种改进算法。本文的主要研究工作及贡献如下:(1)针对现有算法划分结果在准确性和稳定
白色发光二极管(light-emitting diode,缩写为LED)相对于传统照明技术具有能耗低、效率高、无污染、寿命长等优点,已逐渐取代了照明用的白炽灯和荧光灯。目前,照明用的白光LE