【摘 要】
:
人工智能自出世以来几经沉浮,终于在算法突破、算力提高及海量数据的推动下于21世纪迎来了质的飞跃。卷积神经网络(Convolutional neural network,CNN)作为代表算法之一,在医学、无人驾驶、语音识别等领域都表现优异。CNN需要对大量测试样本进行训练从而更新网络参数,想要获得更高的识别精度,其代价是更多的网络参数和更大的计算复杂度。Winograd算法可通过减少卷积层所需的乘法
论文部分内容阅读
人工智能自出世以来几经沉浮,终于在算法突破、算力提高及海量数据的推动下于21世纪迎来了质的飞跃。卷积神经网络(Convolutional neural network,CNN)作为代表算法之一,在医学、无人驾驶、语音识别等领域都表现优异。CNN需要对大量测试样本进行训练从而更新网络参数,想要获得更高的识别精度,其代价是更多的网络参数和更大的计算复杂度。Winograd算法可通过减少卷积层所需的乘法数量来降低算术复杂度,加速CNN计算;此外,基于实际应用中对性能、功耗、隐私等因素的考虑,CNN硬件加速器的地位逐渐重要。基于Winograd算法的卷积专用计算单元的适用范围有限,这导致加速器需要额外的计算单元来执行传统卷积和全连接层的计算,计算资源利用率降低。针对上述问题,本文基于现场可编程门阵列平台提出一种多卷积模式的神经网络硬件加速器方案。本文主要工作包括:1.设计一种基于级联的Winograd-MAC可配置计算结构。通过分析传统卷积和Winograd算法的异同,基于资源分时复用的思想设计了一种可配置计算结构。简单配置该计算结构即可实现两种卷积算法以及各种卷积尺寸的计算。并为该计算结构设置级联加法器,留出级联输入和输出接口,通过多级级联可实现单个卷积核内及多张输入特征图卷积结果的相加。相比专用计算单元,该计算结构可减少50%的DSP及34.09%的LUT硬件资源消耗。2.提出基于流水线的输入矩阵转换电路设计。针对提前转换带来的存储压力,设计能够在计算循环中实时完成输入矩阵变换的转换电路。该输入转换电路结合了不同滤波窗口重叠部分共享初阶转换结果的特点,为初阶转换和次阶转换分别设置专用计算模块,使两个阶段的转换能够流水进行。随着输入特征图尺寸的增大,该设计方案的转换速度优势会更加明显。3.探索并比较两种权重分发方法,并基于单播权重分发方法实现了一种多卷积模式的CNN硬件加速器。该加速器具备两种工作模式,可选择配置传统卷积与Winograd卷积,在加速小尺寸卷积计算的同时也可以适配大尺寸卷积计算。实验表明,其吞吐性能可达379.98GOPs,资源利用效率为0.495GOPs/DSP。
其他文献
成像式心冲击描记术(imaging ballistocardiography,iBCG)是一种基于视频的非接触式心率测量技术,其通过视频提取受试者头部因心脏跳动导致的微弱机械运动信号,进而计算心率。由于该技术具有操作简便,成本低等特点,获得了研究人员的广泛关注。然而,由头部自主运动引起的刚性运动和由面部表情引起的非刚性运动很容易对iBCG的测量造成干扰。本文提出一种运动鲁棒的iBCG新方法(rob
随着现代社会的高速发展和城市化的加快,居民持有汽车的数量在急速的增长,在给人们带来便利的同时,由于道路车辆过多、道路和安全意识匮乏等诸多原因,车辆行驶安全问题日益突出,交通安全形势严峻,正逐渐成为人们关注的焦点。所以,人们寄希望于将现代高科技技术应用在车辆上,从而降低事故的发生率,智能交通系统由此诞生。汽车生产商将此系统与车联网技术的使用,具有解决交通安全问题的可能,并且拥有广大的市场和美好的发展
在人们快节奏的生活模式下,心血管类疾病发生的概率大大增加,已成为威胁人们身体健康的主要因素之一。心率,作为一种身体机能反馈指标,在心血管疾病的预防和诊断中都发挥着极为重要的作用。对于心率的测量,人们在很长一段时间内依赖于传统的接触式方法。但是,在连续监测过程中,接触式会带来活动受限和皮肤压迫等弊端,因此在动态心率监测和特殊人员护理等方面实用性不足。近年来,成像式光体积描记术(Imaging Pho
群组行为识别是计算机视觉领域中一项具有挑战性的任务。与传统的个体行为识别相比,群组行为识别不仅需要理解场景中个体的行为,还需要推断个体之间的潜在交互关系。准确捕捉场景中的时空信息,并对个体间的交互关系进行推理是理解群组行为的关键。本文在总结现有群组行为识别方法的基础上,考虑个体行为理解对群组行为识别的重要性,致力于构建灵活有效的交互关系推理网络,主要解决群组行为识别任务中以下几个问题:第一,考虑个
大力发展光伏(Photovoltaic,PV)发电可以缓解我国目前面临的能源短缺、电力供应不足以及环境污染等问题,独立光储系统不依赖电网运行,在无电或频繁停电的场所得到了广泛应用。在光储系统运行过程中应保证瞬时功率平衡、系统稳定、安全运行,因此如何有效地解决光储系统功率分配和能量管理控制问题依然迫在眉睫。本研究选择将超级电容(Super Capacitor,SC)与全钒液流电池(Vanadium
条纹投影轮廓术作为一种非接触式三维测量技术,因其高速、高精度以及高鲁棒性测量能力而广泛应用于工业诊断、视觉导航,医学诊断等众多领域。高速,高精度的测量是条纹投影轮廓术的最终目标。然而,提高测量速度,特别是在不降低测量精度的情况下,是条纹投影轮廓术发展中存在的一个巨大的挑战。并且条纹投影技术在新领域单像素测量领域应用较少,而单像素测量在非可见波段有优秀的表现,将两种技术结合进行测量的方法值得深入研究
柔性力学传感器由于具有随形性、延展性等特点,其在可穿戴电子、服务型机器人等新型领域上具有较大应用潜力,从而成为当前研究热点之一。碳系导电高分子复合材料符合柔性力学传感器良好体表共形要求兼具成本优势被大量应用。利用实验手段来探究碳纳米管和石墨烯共混对传感器电学性能上的提升难以揭示它们行为的物理规律。通过建立数值模型或解析模型才可以准确探究粒子微观参数与材料宏观参数间的联系。本文创新的通过建立适合于三
聚氨酯是一种具有广泛用途的高分子材料,国内的聚氨酯消费总量占据全球的半壁江山,聚氨酯的化工生产在旺盛的市场需求下具有巨大的市场潜力。近几十年中国聚氨酯生产技术发展迅速,生产规模显著扩大,但是随之产生了生产现场分散管理困难和生产数据的“信息孤岛”等问题限制了企业的进一步发展。搭建统一的生产数据中心,设计可以集中监控生产现场和查询统计生产数据的信息系统具有重要意义。课题组之前为安利公司开发了一至三期聚
随着机器视觉在自动化生产领域的广泛应用,在测量和装配设备中加入视觉系统,根据视觉定位的结果引导设备执行后续任务,对提高设备的感知和决策能力具有非常重要的意义。本文以机器视觉和图像处理技术为基础,主要对测量仪器及装配机械臂等设备的视觉引导及定位技术进行研究。对相机的成像原理及双目视觉成像模型进行分析,对张氏标定法进行了详细的推导,选取合适的相机与镜头设计并搭建了标准的双目视觉系统实验平台,通过标定实
随着计算机视觉技术的不断发展,图像已经成为传递信息的重要媒介,如何从海量的图像数据中获取人们需求的高质量的图像显得尤为重要,图像修复作为图像处理中的关键技术,已经成为计算机视觉领域重要研究课题之一。近几十年年来,国内外学者基于数学建模等理论对图像修复做了深入研究,并尝试将其从实验推广到实际应用。然而,实际应用中图像受损区域复杂多变,传统图像修复算法难以完成高质量的修复过程。近年来,深度学习凭借其对