基于XNOR算法的FPGA加速IP设计与验证

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:RyanDay
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着2012年AlexNet的横空出世,运用卷积神经网络的深度学习方法逐渐成为了的图像处理的热门方向,并且已经有许多实用部署。而包括当前最主要的部署平台GPU在内的各种神经网络部署平台都存在各自的缺点。GPU功耗过高、价格昂贵;CPU计算能力难以使神经网络部署达到很好的效果;ASIC难以适应当前未完全成熟的神经网络模型的迭代更新。FPGA配置灵活,能够提供强大的并行处理能力。但其相对GPU来说,存在浮点运算能力相对较弱,开发周期长的缺点。本文针对FPGA的这些缺点,提出一个针对XNOR算法的FPGA IP核实现方法,性能优良。设计采用XILINX HLS方法,使得可移植性大大提高,降低了FPGA开发周期。采用XNOR算法的神经网络在网络精准度良好的情况下,使用单比特数据对权重及输入进行表示。在大大降低其权重所需的存储空间的同时,使得运算仅需要通过逻辑操作进行。本文首先分析了卷积神经网络当中各种类型层的计算步骤,并且分析了XNOR的算法实现及训练步骤。然后归纳了采用XNOR算法的神经网络的结构特点,并提取了设计中的关键参数。最后设计了加速IP,获得了与当前主流加速器相当的性能。本文使用该方法通过XNOR的AlexNet对其有效性进行验证。然后使用XNOR算法,对LeNet进行改造,应用在包含DSP与FPGA的硬件平台上,以验证本设计方法的有效性及可移植性,取得了不错的效果。
其他文献
教师职业倦怠早已是一种普遍存在的职业病和社会现象,研究显示职业倦怠会影响教师的情绪劳动,一般自我效能会影响职业倦怠,但已有成果尚未研究职业倦怠与情绪劳动和一般自我
荷载作用下氯离子在海工混凝土中的传输是导致其结构劣化的主因。目前对氯离子在混凝土中传输特性的研究主要将其传输系数视为常数,实际上传输系数是多因素影响的变化值。此外,当前多数理论和试验研究侧重于氯离子一维方向的传输,而对更加符合实际情况的二维方向的传输研究较少。因此,研究荷载作用下的氯离子多维变系数的传输特性,对于混凝土结构耐久性的研究具有重要理论和现实意义。本文研究内容和结论如下:(1)氯离子扩散
以太坊被称为区块链2.0技术,其最主要的设计思想就是基于智能合约的上链技术,在以太坊大受欢迎的过程中,智能合约却也一直面临着多方面的安全漏洞的问题,这些漏洞经常受到黑客的攻击,从而导致在过去几年中造成的虚拟货币的损失达到数亿美元。因此本论文设计和实现了一个有效的智能合约扫描器,为智能合约应用商和开发者提供安全审计,这不仅能提升维护开发者和区块链用户的安全,也能显著推动区块链行业的健康化发展。本论文
伴随着智能制造的步伐,具有智慧管理特征的“无人工厂”应运而生。而作为工业生产流水线主力军—工业机器人,已经广泛的应用于工业实际生产中,极大地提高了生产效率。在搬运体积大,质量重以及形状不规则作业过程中,单一机器人在信息获取、处理、动作控制等方面存在一定的局限性。多个机器人通过协作,可以完成单机器人难以完成的复杂作业,使多机器人系统解决更多地实际问题。文章提出双机器人系统协调搬运作业控制方法,解决单
缺陷检测在工业应用中是一项非常重要的环节。近几年基于机器视觉的缺陷检测算法主要是借鉴各种深度神经网络,直接对表面图像进行缺陷检测。但在实际应用中,尤其是机器巡检中的缺陷检测,会存在动态背景干扰、直接检测速度慢、训练模型时缺陷样本少等问题。本论文针对机器巡检视频缺陷检测的特殊问题,研究了运动场景目标分割、视频序列异常快速检测和表面纹理缺陷检测算法,并基于以上算法实现了适用于户外机器巡检的快速缺陷检测
Carbyne被定义为由sp杂化成键碳原子构成的无限长线性碳链,是真正的一维碳同素异形体。理论计算表明,Carbyne是世界上最硬的材料,其抗拉强度为碳纳米管和石墨烯的两倍。然而,随着连续的sp碳原子数量的增加,线性碳链(Linear carbon chains,LCCs)会变得越来越不稳定,因此在实验室合成超长LCCs仍然是一个巨大的挑战。Polyynes(C2nH2)可作为前驱体分子填至双壁碳
伴随着互联网时代的进一步崛起与5G时代的到来,传播渠道得到不断发展与拓宽,与此同时,传播媒介也不断诞生出新的可能,使得纪录片这一传统的艺术形式得以发展与蜕变。微纪录片,这一新兴的创作模式,打破传统纪录片的创作格局,在众多主流网络与自媒体平台上广泛传播,并受到颇多关注。在当下的影视文化语境中,叙事形式不断革新,探究如何在传统纪录片的固定模式下推陈出新,用一种全新的叙事方式表达主题,应对更加多元的受众
氮掺杂的石墨烯本身具有良好的电化学性能,制备的微球结构因具有大比表面积,电催化性能更加优异,作为超级电容器电极材料具有广泛的应用前景。旋转圆盘电极是测量材料电化学本征反应速率的一种常用方法,通过旋转运动产生的强迫对流,可在一定范围内消除浓差极化。然而采用经典电极动力学模型(Koutecky-Levich公式)得到的反应速率仍然受传质过程影响。且氮掺杂的石墨烯微球电极并非传统的平板电极,表面的多级孔
序列模式挖掘问题,由于其在实践中广泛的应用,已引起学术界的持续关注。虽然目前已经有一些序列模式挖掘算法,但因为它们需要多次扫描整个数据库,所以效率相对较低,并且大多数算法都没有考虑到时间因素对序列模式挖掘的影响,它们并不能对有时间限制要求的序列模式进行出现频率的统计和挖掘。在对各个序列模式的出现频率进行统计的算法中,ONCE算法可以在只扫描一次数据库的情况下,统计出带有时间约束的序列模式在序列流中
现今,越来越多超级抗药细菌的出现对人类的健康产生了严重的威胁。面对众多的多重抗药致病菌,单靠开发新药的传统方法是远远不够的,我们亟需新的策略。因此,近年来人们开始关注细菌耐药性的分子机理,希望以此找到新的突破点。我们前期的研究表明,大肠杆菌(Escherichia coli)YihE激酶是细胞程序性死亡途径的关键调控因子,在抗生素处理细菌时能起到保护细菌的作用。然而,YihE激酶的细胞通路及其在细