基于PYNO低精度神经网络的实现

来源 :云南大学 | 被引量 : 0次 | 上传用户:xia__1989
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
卷积神经网络都具有深层的模型深度和数量巨大的参数,这对其在低功耗和硬件资源少的嵌入式设备上应用造成阻碍。FPGA拥有易并行性、高度的灵活性和低能效等特点,降低模型复杂度和参数量将卷积神经网络部署在FPGA上成为近几年研究的热点。本文采用参数量化的方法,提出了一种量化卷积神经网络的方法,将神经网络的参数从浮点精度量化至1-bit等低位宽的定点精度,在向前向后传播时,利用比特卷积核在低位宽的权重、激活和梯度上训练推理,极大的减少了计算量和运算时间。设计1-bit权重和2-bit激活参数的ImageNet网络拓扑,和1-bit权重和3-bit激活参数的PascalVoc网络拓扑。与浮点精度对比表明,量化的两种网络拓扑参数计算量均大幅减少,在ImageNet上取得51.3%的Top-1准确率和75%的Top-5准确率,在PascalVoc上取得m AP为53.1%的准确率。针对量化神经网络在FPGA上的优化,提出了BRAM中的循环流架构通过计算单元实现层与层的并行。设计矩阵向量阈值乘法单元,其中用于点乘积计算的PE经过SIMD流水线优化卷积计算;采用矩阵交错排序技术将计算转化为普通矩阵乘法运算;使用矩阵折叠技术用计算空间来优化硬件资源使用率;利用HLS设计工具将架构和计算单元进一步优化实现生成IP核,然后在Vivado环境中集成硬件整体通路。最后,采用PYNQ-Z2开发板搭建系统平台,以实现设计的两个神经网络。利用Python语言调用ARM处理器和FPGA硬件资源,对图片数据完成预处理、推理计算以及结果分析。实验表明PYNQ-Z2在图像分类与识别两个实验中均取得令人满意的性能表现,图片分类与识别的处理时间约在1.2s系统的功耗约2w,证明了基于PYNQ低精度神经网络实现的可行性。
其他文献
随着后基因组计划的进行,以及高通量生物测序技术的蓬勃发展,推动生物数据呈现出指数级的增长,生物计算已经渗透到了生物学的各个领域,以蛋白质的琥珀酰化为例,判断蛋白质序列中的哪些赖氨酸残基发生琥珀酰化修饰,是蛋白质功能研究中一项非常重要的工作。通过传统的方式来处理这种问题主要通过质谱分析的方法,这种方法会耗费过长的时间周期,以及巨大的人力财力,因此近年来开发了多种基于计算的方法。本文从蛋白质序列出发,
学位
随着在线社交平台飞速的发展,社交媒体成为人们获取信息的主要来源,在线营销成为主流的营销方式。大量商家将自己的产品在网络发布,通过社交网络进行病毒式营销。营销的关键在寻找具有影响力的种子用户,通过种子用户的口碑传播实现最大化影响范围,提升营销效果。为了找到符合要求的种子用户,影响力最大化问题被提出,并受到学界广泛的研究。传统的影响力最大化问题往往只关注影响范围,忽略了营销中的商业因素。真实的病毒式营
学位
伴随着我国对破产企业救治和清算工作的稳妥推进,破产相关案件的优化审理对市场规范、资源整合的重要影响也愈加凸显。破产和解制度作为破产的三大支柱之一,在对企业救治中发挥着积极作用,但其较之破产重整制度,其运用率仍然较低。探其缘由,一则是在美日等国对传统破产和解制度的深度改革,导致和解制度面临退出历史舞台之尴尬境地。另一则是由于作为替代机制的破产重整制度不断革新和发展,我国破产和解制度在立法上存在缺漏,
学位
新型冠状病毒(SARS-Co V-2)是一种RNA病毒,其Spike蛋白的受体结合域(RBD)与人类ACE2受体结合,从而介导病毒进入细胞。随着新型冠状病毒在全球的持续爆发,出现了大量RBD区域组合突变(相对于野生株)的新毒株。已有研究表明,RBD-ACE2的结合亲和力与新型冠状病毒的侵染能力相关。然而,通过生物试验方式获取突变毒株RBD-ACE2结合亲和力费时费力,且远远落后于突变株序列的积累,
学位
纹理合成是计算机图形学领域的基础研究课题之一,随着多媒体技术的发展,纹理合成也在许多新型领域中得到应用,如游戏建模、电影渲染、虚拟绘制等。基于样本的纹理合成方法要求合成与样本图像尽可能相似的纹理,传统方法在实现这一目标方面取得了显著进展,然而对于复杂的纹理图案,已有的方法由于提取特征能力不足而导致合成结果错误。近年来,深度学习方法被广泛用于图像处理领域,然而,无论是传统的纹理合成方法,还是最近出现
学位
视觉问答任务是一个相对比较新的研究领域,不同于图像分类、目标检测、语义分割等传统视觉任务,视觉问答是将一张图像和关于这张图像的任何形式的问题作为输入,输出一个与问题相关的正确答案。因此视觉问答是一项结合计算机视觉、自然语言处理和多模态特征融合的任务。在医疗领域,自动化辅助系统提供的“第二意见”可以增强临床医生解读复杂医学图像的信心,所以医疗领域的视觉问答技术作为新型数字化智能医疗设备投入临床的应用
学位
视频目标跟踪技术已经应用到了生活的各个方面,如视频监控、自动驾驶、无人机跟踪等。尽管如此,由于各种视频场景的复杂性和不同行业对跟踪的不同要求,目前仍然没有一种能够适应各种复杂场景(如目标遮挡、尺度变化、相似对象干扰等)的目标跟踪算法,尤其是在无人机目标跟踪当中。本文针对相关滤波框架下无人机跟踪算法目前存在的一些问题,从目标函数、模板更新方式、特征提取三个方面进行了改进,主要改进内容如下:(1)在目
学位
随着在线教学逐步发展为高等教育教学的“新常态”,联合国教科文组织也一再强调公平地承认各国学生通过在线学习获得的资历,这为跨境教育的发展和学生流动带来了新的发展路线和突破口。然而,在线教学存在着师生信息素养水平不高、学习自主性差等不容忽视的“质量”问题,为了确保所有人能平等地获得高质量的教育,对于在线教学这种非传统教学模式进行质量保障至关重要。本研究基于亚太地区教育质量保障组织(APQN)的“APQ
学位
近几年硕士生持续扩招政策颁布之下,研究生培养存在量的扩张与质的冲突,从而引发社会公众对研究生教育教研质量的担忧。跨学科硕士研究生作为研究生教育的重要组成部分,他们升学前的经历、学科背景、学习行为和学习需求都具有多元化、与非跨学科硕士生相比具有异质性。因此关注跨学科硕士研究生的成长和发展,既是本研究的主要问题也是影响研究生教育质量的关键。本研究选主要采用了问卷调查法和访谈法,以改编问卷《跨学科硕士研
学位
场景一致性是指场景中的目标与其所处背景之间的一种关系,其主要受场景特征信息和语义信息的共同影响。在现实世界中,场景是指拥有一个或多个目标和背景的综合图像信息,在一致性场景中,目标出现在当前背景是大概率事件,在不一致场景中,目标出现在当前背景中是小概率事件。在目前的相关研究中,动物目标被认为是一种特殊的目标,其在人类的视觉系统中有着特殊的识别机制,从而使得动物目标的识别速度一般快于其他目标的识别速度
学位