面向人脸检测识别任务的可扩展结构加速器研究

来源 :国防科技大学 | 被引量 : 0次 | 上传用户:liyuan04981
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
人脸检测与人脸识别技术有着极其广泛的应用,尤其随着深度学习的发展成熟,使得基于深度学习的人脸检测与人脸识别技术已经超过了人类肉眼的辨识水平,但随之带来的是计算量的急剧增加。面对众多人脸检测与人脸识别应用场景,如何加速其推理性能成为急需解决的问题。本文基于FPGA平台研究人脸检测与人脸识别深度卷积神经网络前向推理并行化技术。本文首先从前向推理运算的角度研究了基于深度学习的人脸关键点检测算法与人脸识别算法的运算流程与运算特点,并以一个具体算法实例为切入点进行了研究,针对人脸对齐设计了适合硬件实现的快速算法。接着我们对人脸检测算法的量化进行了研究,提出了低位宽全局量化方法,在精度影响有限的情况下使带宽占用降低了50%。本文选择通用矩阵乘加速器进行人脸应用加速,针对这一硬件结构进行了改进与性能建模,设计的加速器并行性搜索算法,可以根据硬件资源条件和不同的卷积神经网络结构适配不同的加速器阵列结构从而使加速器理论性能最优。本文最后在Zynq7020芯片的FPGA上实现了加速器的设计。实验结果表明,加速器在该平台可以达到吞吐率35GOPS的性能,相比CPU平台和GPU平台,在性能功耗比上是前者的15倍和5倍。
其他文献
大数据时代迫切需要性能强劲的计算基础设施为企业和个人提供服务,构建分布式系统是一种比较合适的方案。随着分布式软件基础架构越来越复杂,新的复杂问题陆续显现。其中,性能和可靠性对于分布式系统非常重要,缓慢低效和不可靠的分布式系统容易让用户遭受到经济损失。虽然近十年分布式软件发展非常迅速,其性能也得到了明显的提高,但是性能缺陷仍然危及分布式系统的可靠性。虽然对于单机系统中的性能缺陷已经有了不少的研究,但
目标识别基准图制备是飞行器目标识别的关键技术之一,该技术为景象匹配提供基础的数据保障。高精度高时效性的基准图像制备技术对于提高识别的精度至关重要,基准图像中的像素定位误差直接影响识别的精度。近年随着惯导相关传感器精度的提升、无人机控制技术成熟,利用无人机拍摄的航空影像数据已成为制备识别地面目标所需基准图的趋势。本文利用基于带成像平台的无人机拍摄图像接开展基准图制备方法的研究。在制备完成基准图后深入
随着信息技术在教育中应用更加广泛,大规模在线开放课程作为信息时代一种新的教育形态,快速渗透到我们生活之中.在线学习不受时间、地域的限制,提升互动体验,实现在线学习的个性化学习.但是也面临着投入时间不足、缺少计划、突击浏览、随机终止、高辍学率、低通过率等问题.传统课堂的质量分析方法(专家主导、基于标准、阶段性)又很难适应于分析在线课程视频吸引力.需要提出新方式、新方法研究在线课程视频吸引力.从而加深
关联成像是近年来发展出的一种新型成像方式,它区别于传统的直接成像,在抗散射成像、医学造影、低成本红外遥感等方面具有巨大的潜力和应用价值。关联成像是一种非点对点的成像,具有光路的非定域性,通过收集物体反射或者透射光的总光强值,与参考臂光场做关联运算提取出物体的透射率或者反射率信息。光的偏振很早就被人们所熟知,但其实际应用却是近几十年才得以发展。近年来依据偏振原理的偏振去雾、水下成像、伪装识别等应用也
随着选择性激光熔融(Selective Laser Melting,SLM)等金属3D打印技术的日渐成熟与发展,改变了金属零件设计受传统加工工艺制约的局面,使得封闭内腔、复杂曲面等复杂结构的制造成为可能,极大的拓宽了机械零件的设计思路。利用3D打印技术可以实现战场装备维修的柔性保障和伴随保障,然而装备零件大多数是根据传统加工工艺要求进行设计的,零件内部往往存在材料冗余,严重影响零件3D成形的速度,
MOOC(Massive Open Online Course,大规模开放在线课程)等在线教育模式的普及为全球学习者带来了革命性的教育资源升级的同时,也使更多的学习者陷入知识迷航的困境。为了提高在线教育资源的利用率,深入挖掘MOOC之间的关系,本文围绕MOOC资源知识图谱的构建和应用展开研究,以构造一个多源实例丰富、内部联系充分、实体关系准确的跨平台的MOOC资源知识图谱为目标,为使用者提供更具针
目前,人工智能在图像处理领域已经取得了很大的成功,这主要归功于以深度神经网络为代表的一系列机器学习模型。在大规模训练数据的驱动下,通过层次化的图像特征提取,机器学习在很多图像处理任务上已经超过了人类极限。具体来说,目前主流的图像特征提取方法大多数都是建立在训练数据和实际测试数据有着较强的一致性这个假设之上的。然而,在大多数实际应用场景中,实时处理的数据流(测试数据)和训练数据的分布之间通常存在较大
新城区的发展对城市整体结构的合理化和社会经济的可持续发展起着重要的作用。从中国城镇化发展的角度来看,新城区的发展是推进城市空间向外扩张、重新进行城市产业布局、实现城市兼并乡村的有效途径。吕梁新城区自2012年10月动工以来,城市扩建取得了显著成效,但瑕不掩瑜,吕梁新城区在其建设发展过程中也存在规划设计不够合理和城市建设融资困难等问题和不足。本论文采用资料收集法和经验总结法,通过总结和借鉴国内外理论
随着信息化装备相继配发部队并普遍运用,仅依靠部队自身力量已经不能满足装备故障应急快速抢修任务需求,而依靠民用抢修力量并有效整合军地间资源,可以有效提升部队的装备精确保障能力。装备精确保障的核心和实质是利用“信息流”导引“物质流”,即开展基于军民融合的装备故障应急快速抢修的关键是各级保障机构通过信息系统实现各种保障信息地获取与利用,并通过科学预测、综合评估,实现保障机构的高效协同。本文围绕基于军民融
近年来,云计算的相关概念得到广泛普及,基于云平台的应用技术也成为研究热点,云数据中心在信息和互联网技术中扮演着不可或缺的重要角色。但与此同时,其快速发展的同时,面临的潜在安全威胁也逐渐凸显。云数据中心网络监控的性能开销大以及云端恶意软件更新频繁的问题日益突出。如何有效地提高我们对云端恶意软件的主动检测能力对于如今云平台安全防护起着至关重要的作用。本文对基于强化学习的云端未知威胁检测技术进行了研究,