面向人脸检测MTCNN网络的加速硬件设计

来源 :计算机工程与设计 | 被引量 : 0次 | 上传用户:changjian200910
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为加快深度学习人脸检测算法MTCNN(multi-task convolution neural network)的推理速度,满足许多应用场合检测的实时性的要求,基于Xilinx FPGA ZCU102开发板设计针对MTCNN专门优化的卷积和全连接加速硬件.该加速硬件不仅适用于MTCNN网络,其它神经网络推理算法也可以使用.针对算法特点,硬件采用小而多的计算核心,支持动态分块、图像间混合计算、片上多核共享RAM等完全自主开发的软硬件协同技术.在100 MHZ的频率下对MTCNN应用在加速器上的加速效果进行测试并和ARM程序进行对比,可以得到加速器相对于ARM O2速度加快了6倍多.
其他文献
针对传统船舶电网绝缘监测装置可靠性不足、受泄漏电容的影响较大、测量范围较窄、测量准确度不高等问题,以船舶IT交流供配电网络为研究对象,建立一种能够实时监测整个电网系统对地绝缘值与泄漏电容值,实现实时故障定位的系统,并结合Hausdoff距离算法进行容错计算.结果 表明:该系统可实时监测船舶电网的绝缘状态,并实现故障线路的准确定位,为操作人员保养设备和抢修设备提供最及时、最准确的判断信息,能够做到尽快排除故障,恢复供电,保证机电设备随时处于备航状态.
针对无线传感器网络中能耗不均衡、生命周期短的问题,提出WSN中能耗均衡的非均匀分簇路由算法.通过改进的K均值算法进行非均匀分簇,引入双簇首减轻簇首通信压力;利用基尼系数衡量簇内节点的能耗均衡性,以动态权值调整影响副簇首竞选的因素;簇间采用单跳和多跳相结合的传输方式,将剩余能量、传输距离、转发次数和节点数作为中继节点选择的依据,均衡簇间传输能耗.仿真结果表明,相比LEACH和EBRAA算法,提出算法能有效均衡节点能耗,延长生命周期和提高吞吐量.
针对舵机检验时安全阀排量出现不满足规范要求的问题,以某160 kN·m舵机为研究对象,分析了舵机参数,并进行了选型计算,发现不同规范计算得出的排量结果不同,造成选型不同.研究结果表明:舵机安全阀的排量应根据计算出的液压泵最小供油量考虑,在经济性和安全性上都能符合要求.
为提升移动流媒体的用户体验质量(quality of experience,QoE)和设备续航时长,提出一种基于移动设备电量状态的Qo E模型,模型的参数包括初始延迟、重新缓冲、平均视频质量、码率切换平滑度以及设备电量状态.在模型的基础上,给出一种基于网络吞吐量,同时又考虑设备电量状态的码率自适应策略.策略能避免客户端在设备剩余电量处于中、低状态时,请求高码率视频,导致过多的电池电量消耗.实验结果表明,该策略能有效平衡不同电量状态下用户对视频质量和设备续航的需求.
针对城市路网短时交通流预测受到许多复杂因素的影响,提出一种基于深度时空残差网络的路网短时交通流预测模型DST-ResNet(deep spatio-temporal residual network).针对时空数据的两个独特属性邻近性和周期性分别设计相应的残差网络分支,通过为两个分支中相同的道路分配不同的权重动态聚合两个分支网络的输出,调整时空属性对不同路段交通流预测的影响程度,将两个残差网络的聚合结果与外部因素进行融合.通过选择RMSE和R2为模型的评价指标进行实验验证,该DST-ResNet模型相较主
针对现有基于商用WiFi设备的人体手势识别方法存在的子载波选择不够优化、动作区间截取不够精确等问题,提出一种基于近似熵子载波选择的人体手势识别(AEGR)方法.利用提出的最小近似熵法构建识别方法待处理的CSI幅值数据,对构建的数据采用小波去噪和中值滤波组合法进行去噪;利用滑动窗极差法精确截取CSI幅值的动作区间,据此提取用于分类的8个特征量;利用随机森林算法进行人体手势识别.实验结果表明,AEGR方法的手势识别准确率可达98.75%,验证了其良好性能.
为解决移动传感网在拓扑流动性较高情形下存在的定位精度不高、数据传输能力不理想等不足,提出基于双焦点离心测距机制的移动传感网高效定位算法.对多跳路径进行弧度处理,构建基于弧度路径析构的节点椭圆定位机制,将直线路径析构为椭圆弧度边长,避免因裁弯取直而导致定位距离出现偏移,结合锚节点坐标已知的特性,对待定位终端坐标进行精度修正.设计基于椭圆纵半径跳数优化的动态测距机制,降低待定位节点与锚节点之间拓扑跳数,改善节点定位精度.仿真结果表明,与当前常用的WSN定位算法相比,所提算法具有更高的定位精度和更低的定位次数.
为基于国产平台研发安全可靠的远程桌面程序,对目前已有的各种远程桌面程序进行分析与研究,其中重点研究Linux平台上基于RFB协议的VNC程序.针对基于RFB协议的VNC程序,对其基本框架及工作流程进行分析与研究,重点研究图像消息的传输、屏幕变化的检测以及图像的压缩编码方式,针对目前国产化发展应用需求以及现状,为进一步提升VNC程序的性能,以满足国产信息系统的新需求,提出未来需改进的方向.
针对现有BPLC网络组网协议在回复关联确认消息的数量和时间上存在冗余的问题,对BPLC报文交互过程进行研究,提出一种基于自适应组播的高效组网协议.通过自适应地聚合关联确认消息并采用组播方式发送,在减少控制开销的同时加速发送部分关联确认消息.理论分析显示了该协议的有效性.仿真结果表明,与现有BPLC网络组网协议相比,该协议能够减少5.88%以上的控制开销并降低5.53%以上的入网时延.
基于已有的区块链和访问控制相结合相关的研究存在难管理访问权限、低效率、难支持轻量级物联网设备的缺点,提出一种基于属性的物联网访问控制模型.通过引入属性的概念,支持细粒度的访问控制;将访问控制策略以智能合约部署在区块链上,降低物联网设备的计算压力,使该策略可以应用于轻量级设备;引入token概念,通过访问主体提前申请访问权限,提高访问效率.搭建原型系统,通过案例分析和安全性分析,验证了该访问控制模型的有效性.