基于深度学习的IP核的数据访问模块研究与验证

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:llizhixiong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着人工智能的发展,深度学习作为其最具突破性特点的领域之一,已广泛应用于卫星,军事,医疗,自动驾驶等各个方面,但强大的算力背后,需要大量数据和带宽的支撑,如何正确,高效地对大数据进行访问,包括传输和处理,一直是研究的热点,其正确性会直接影响到深度学习的性能。为此本文针对一款自研的深度学习IP核,研究了其数据的传输,处理方式,并对其相关模块进行验证,本文的主要研究内容及创新点包括以下方面:首先本文介绍了深度学习框架中的卷积神经网络算法和池化算法,并由此引出数据访问的核心模块:DMC模块和PW模块,并使用UVM方法学,分别对两个模块展开研究与验证。其次对DMC模块搭建UVM验证平台,DMC模块服务于卷积神经网络算法,负责对传统的卷积数据比如feature map和weight进行存取,传输和适当预处理,同时还引入RGB,interleave等数据模式来适配前后端图像处理单元,平台针对此设计了对应的sequence以及对应的uvm组件负责发送激励,编写了sanity,direct,random等多种测试用例,对四维tensor转换为线性地址的算法,和收到数据的处理比如对feature map做2h_mode操作以加快运算等操作进行验证,并编写功能覆盖组收集功能覆盖率。最后对PW模块搭建UVM验证平台,设计sequence发送Arbiter通路和MAC通路激励,设计测试用例来验证用于降低性能损耗trios功能,对数据进行升采样以保留数据特征的d2s功能,以及数据压缩的VLC功能,并编写功能覆盖组收集功能覆盖率。本文为深度学习芯片的数据访问模块:DMC和PW搭建了UVM验证平台,保证了DMC模块在各种数据模式,数据格式下对存储地址的正确计算以及对数据的正确处理,也保证了PW模块在各种机制下对数据的正确计算。最后,测试用例全部通过,DMC模块的代码覆盖率达到96.94%,功能覆盖率为100%,PW模块的代码覆盖率达到99.86%,功能覆盖率为100%,保证了数据访问的正确性,支持了深度学习大数据量的处理与传输,并通过分析与对比,计算出DMC模块的2h_mode模式让MAC开始工作的时间提前了2/HN(H为H维度的数据量,N为N维度的数据量),也验证出PW模块的trios功能对于内存的节省率为2%-5%,计算出VLC在不同场景下的压缩率,分析了现有压缩模式的性能以及不足,总体验证工作达到了预期目标。
其他文献
学位
随着科技的发展和社会的进步,在生产和生活中遇到的问题越来越复杂,用传统的数学方法已经很难快速解决这些问题。其中一类多目标优化问题,由于其多个目标之间往往会互相冲突,导致这类问题几乎不存在最优解。而且由于目标维数的增加,使得传统多目标优化算法的性能急剧下降,传统的方法越来越难以解决这类问题。基于网格的超多目标进化算法Gr EA引入了网格支配的概念,并利用网格设计了种群个体评估的方法,表现出优秀的搜索
学位
医学影像是计算机视觉中一个重要的研究类别,而分类任务则是一个经典的机器学习任务。近年来,在计算机视觉的分类任务上,研究方法层出不穷,这些方法既创造了巨大的经济价值,又产生了积极的社会效益。本文将在具体分析现有医学影像模型利弊的基础上,从数据增广和神经网络模型两个角度出发,提出Softmix模型和Mix T模型,并通过多种实验进行验证。数据增广方面,本文的创新之处是以多张图片融合的方式为基础,优化了
学位
LED作为新一代照明光源,由于其所具有的节能高效,使用寿命长,绿色环保等优势,被广泛地应用在通用照明,汽车及工业照明等多种照明领域。LED优势的发挥离不开性能良好的驱动电路与之相配合,作为整个照明系统的“心脏”,LED驱动扮演着十分关键的角色。当今LED驱动技术的发展趋势主要集中在高转换效率,体积小型化,调光功能灵活,高可靠性等几个方面。但目前LED驱动主要采用硬开关的控制方式,其虽然控制方式较为
学位
即时定位与地图构建(Simultaneous localization and mapping,SLAM)指运动物体根据环境特征来定位自身位姿并进行增量式构建地图,该技术在没有临时定位基础设施的条件下,可实现机器人的轨迹跟踪。基于相机传感器的视觉里程计在近年来有较快发展,其作为视觉SLAM前端,可代替激光雷达计算里程,从而降低系统成本并丰富地图信息。然而,图片处理相对耗时,使得机器人定位实时性降低
学位
由于氧化镓(Ga2O3)材料优良的材料特性,近年来在功率器件和光电探测器等方面被越来越多的人所研究,使其逐渐成为替代传统硅基、锗基和第二代Ⅲ-Ⅳ半导体的优选材料。氧化镓禁带宽度最高可达5.0 e V,衡量功率器件的参数巴利加优值(εμEb~3)高达3440,理论击穿场强可达到8MV/cm,但是当氧化镓与栅氧材料的导带带偏和价带带偏不足时,以及氧化镓材料和栅氧化层接触界面和氧化层内部存在的非理想电荷
学位
随着现代微波射频无线通信系统的飞速发展,对微波射频电路高集成度、小型化、低成本和高性能的要求日渐提高。为满足无线通信系统严苛的要求,可重构滤波功分器及缺陷地结构已经成为当前的研究热点。其中,可重构滤波功分器电路可以将多种功能集中在一个电路上,不仅可以减少对系统空间的占用,还可以减少多个器件级联所带来的插损;缺陷地结构则打破了电路平面技术的局限性,有效的利用了接地板空间,并以其单极点低通特性和高特征
学位
碳化硅的高热导率、宽带隙等优越性能使其在高温环境下可靠工作数小时成为可能,被广泛地应用于电力电子领域。所有SiC基器件中,SiC MOSFET因其较小的拖尾电流、较低的导通电阻、较快的导通关断转换速度、近乎绝缘的栅电极以及耐高温特性而得到广泛的应用。目前,SiC MOSFET已广泛地应用于火力发电、石油勘测、空间探测等重要领域。但长时间处于高温环境下会对器件特性产生影响,甚至引起栅介质退化等,为使
学位
便携式、可穿戴柔性电力电子器件的出现,给予了人们对物质生活的全新体验。与此同时,柔性电子的发展对微型能源器件的需求越来越丰富,不仅要求储能器件可以提供优异的电化学性能,还需要储能器件进一步微型化、柔性化、多功能化,以满足柔性电子自身多功能集成的要求。传统的储能器件如锂离子电池等,因其体积大、机械性能差等原因,无法在柔性电子领域广泛应用。自驱动传感一体化器件的出现,成为影响柔性电子器件发展的关键性因
学位
全球定位系统(Global Positioning System,GPS)定位和简单的通知服务正变得越来越先进。这一进步增强了空间关键字搜索,其包括内容位置和文本描述。许多web应用程序依赖于不断搜索空间关键字对象。云服务提供商(Cloud Service Provider,CSP)可以处理从各种来源收集的各种空间web对象,以节省本地计算和存储资源。然而,一个主要问题是,尽管已经提出了一些方案来
学位