【摘 要】
:
深度学习发展至今已经衍生出了多种多样的算法网络,最具代表性的算法之一就是卷积神经网络,其在语音、图像、自然语言处理等各个领域都取得了惊人的成就。如今常用卷积神经网络的计算环境多为CPU或GPU,巨大计算量带来了功耗及成本问题,因此其实际应用常常面临诸多限制。此外,卷积神经网络结构变化迅速,新的模型和优化方法不断出现,针对不同应用领域结构通常不同。因此,设计一款通用可编程可重构且既能够满足存储和速度
论文部分内容阅读
深度学习发展至今已经衍生出了多种多样的算法网络,最具代表性的算法之一就是卷积神经网络,其在语音、图像、自然语言处理等各个领域都取得了惊人的成就。如今常用卷积神经网络的计算环境多为CPU或GPU,巨大计算量带来了功耗及成本问题,因此其实际应用常常面临诸多限制。此外,卷积神经网络结构变化迅速,新的模型和优化方法不断出现,针对不同应用领域结构通常不同。因此,设计一款通用可编程可重构且既能够满足存储和速度要求,又能够兼顾功耗及成本问题的卷积神经网络处理器是很有必要的。FPGA具有较高的可重构性与能耗比,且能够灵活的重配置,在嵌入式端有着独特的优势。虽然其计算卷积神经网络在训练时大量的误差反传是比较困难的,但在进行前向推理运算时的灵活性与性价比却是CPU和GPU无法相较的。针对以上问题,本文提出了一种通用可编程卷积神经网络系统。该系统主要应用于已预训练好的卷积神经网络的前向推理运算,用于完成目标分类任务。该系统主要包括硬件处理器和软件编译器两个部分,其中硬件处理器是一种采用CISC+MOV指令控制方式的高并行、可编程的结构。该处理器共有1024个并行运算单元用于卷积加速计算,采用单指令流多数据流的并行控制方式实现了指令级和数据级的并行,大大提高了处理器的计算速度。该处理器兼容了主流神经网络的串联结构及残差结构,且优化了全连接层的计算并行度,支持一定条件下用户自定义的网络结构,理论上通过软件编译器的控制,可以实现任意层数的神经网络算法。软件编译器通过其操作界面可以轻松完成不同模型指令及数据的初始化。处理器系统采用Verilog HDL进行电路设计,且在赛灵思公司的VC707开发板上实现。系统将32 bit浮点数据量化为8 bit定点数据,经过实验选择权重数据采用2 bit整数位和6 bit小数位的定点数格式,特征图数据采用4 bit整数位和4 bit小数位的定点数格式。本文选择了 VGG13和ResNet18两种结构不同的卷积神经网络验证处理器的功能性和通用性。处理器系统的主时钟为100 Mhz,总功耗4.409 W。处理器在VGG13和ResNet18网络处理一幅32x32x3的图片分别需要约29.15 ms和28.90 ms,算力分别为16.99 GOPS和38.44 GOPS,二者8 bit定点数运算的识别准确率相较于32 bit浮点数运算的上位机下降不到3.2%。综上,该处理器可以满足目标分类的实时性和准确性。
其他文献
“一带一路”倡议于2013年由中国国家主席习近平首次提出,该倡议自提出以来受到国际社会的高度关注,并逐渐成为中国国内外媒体争相报道的热门话题。受到文化冲突、意识形态冲突及现实利益冲突等问题的影响,国际舆论对于“一带一路”倡议持不同态度。东南亚地区自古以来就是“海上丝绸之路”的重要枢纽。近年来,东盟国家凭借与中国的地缘优势,以及历史渊源与中国的关系越发亲密。中方视东盟为周边外交优先方向和高质量共建“
如今是个信息技术高速发展的时代,大众文化娱乐生活丰富多样,新生事物的出现使人们的审美趣味发生改变,如何通过当代数字技术与非遗结合进行新形式的展示与传播是本文研究的主要内容。山西侯马皮影具有鲜明地方特色与文化底蕴,是我国珍贵的非物质文化遗产,但是随着时代的发展山西侯马皮影日渐失去其文化语境,其传播与发展受到了极大的限制,本文通过对山西侯马皮影交互虚拟展馆的设计,利用数字化技术,从用户出发结合交互设计
时间敏感网络(Time Sensitive Network,TSN)是能够提供确定性传输保障的新一代交换以太网技术。在TSN中,高优先级业务通常由计划流(Scheduled Flow,SF)承载,在IEEE 802.1Qbv引入的门控机制控制下进行传输。TSN中进行SF流量调度,就是在给定网络和SF相关信息条件下,计算并生成全网所有节点输出端口上门控列表(Gate Control List,GCL
后疫情时代,中国正在走出新冠肺炎疫情阴霾,中国经济运行正逐步向常态化复苏。在疫情和国际金融危机的影响下,地区冲突不断,国际经济低迷。为维护国际经济稳定运行,各国与国际组织正寻求经济合作,报团取暖。因此,国际经济法在中外贸易往来中起到至关重要的作用。译者选取《国际经济法原理》进行翻译,旨在提高国际贸易领域从业者和相关专业的学生对国际经济法规的了解,同时促进经贸合作。目前以英美法为基础编写的国际法教材
近年来,大规模灾害和突发事件频发,对社会经济发展和人民的生命财产安全造成了严重的影响,同时也对灾害应急管理工作提出了新的挑战。在时间紧迫和资源压力下进行应急资源调配是一个困难且复杂的决策过程,科学高效的应急资源调配方案有助于提高应急救援效率、缓解灾民痛苦、提升应急管理水平,是灾后应急响应工作的核心。应急资源调配是一个持续的多周期的过程,通常需要行政、企业、医疗、交通等多部门通力协作,涉及应急指挥中
网络态势感知是指在网络环境中对能够引起网络态势改变的要素进行获取、理解、评估、显示以及对网络未来发展趋势的预测等功能。随着Internet网络规模的日益扩大,其复杂性和不确定性也随之增加,传统的网络管理难以取得高效的成果,而基于数据融合的网络态势感知逐渐成为网络管理的热门方向。网络态势感知能够处理多源、多属性、多方面和多层次的网络状态信息,对网络运行状况的发展趋势进行评估和预测,并根据评估和预测的
外辐射源雷达是一种利用非合作信号对目标进行探测的双基雷达,其在抗干扰、抗隐身目标、抗反辐射导弹、抗低空突防等方面有显著优势,在军用与民用领域都有着广泛而关键的应用。在要地防空、机场监视等场景中,对高速机动目标及无人机检测与分类非常重要。然而,由于外辐射源系统结构特性,目标回波信号往往能量微弱,如何在低信噪比下实现对目标能量的有效积累,实现对目标的稳健检测与准确分类成为一大难题。在对高速机动目标检测
随着无线通信技术的高速发展,通信设备广泛覆盖,人们对于高速率通信与实时准确定位的需求日益增大。将定位功能与通信功能进行融合,实现随时随地的数据传输与精确定位服务成为迫切需求,因此,通信与定位一体化成为学术界的研究热点之一。基于无线自组网的通信与定位一体化系统可在基础设施受限环境下快速组网,提供通信与位置服务,同时结合跳频技术优良的抗干扰能力、以及抗截获性能和灵活组网能力,可有效提升系统性能。因此,
战场环境的复杂性、信息的多样性、状态的多变性,为电子干扰带来了巨大的挑战。随着认知电子战的快速发展,具备自适应能力的干扰决策技术备受关注。如何在复杂环境下智能地进行雷达工作模式的识别和干扰样式的选择成为当前干扰决策亟待解决的问题。机器学习是一种智能的数据分析工具,本文研究基于机器学习的雷达干扰决策技术。雷达工作模式的识别是干扰和评估的重要依据,但是新体制雷达的发展,加大了雷达工作模式识别的难度。为
与其他国家相比,我国寿险行业起步较晚,不过我国寿险行业增长迅速,2020年我国寿险保费收入已高达23982亿元。但是从寿险密度、寿险深度来看,我国寿险行业的人均保费收入和在经济总值中的比重都较低。在人口方面,我国人口结构正处在转变时期,人口老龄化程度不断加深,我国人口政策也由早期的计划生育政策向全面二孩政策方向转变,这些因素都对我国寿险行业的发展产生重要影响。在我国寿险区域发展不平衡、人口结构发生