基于FPGA的CNN应用加速技术

来源 :信息技术 | 被引量 : 0次 | 上传用户:learn_vb
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
FPGA(现场可编程门阵列)作为人工智能应用的新加速载体,可替GPU对人工智能应用推理阶段进行加速。文中提出了一种新的人工智能应用加速方案,利用定点、矩阵压缩等方法对卷积神经网络(CNN)模型进行处理,优化CNN网络模型,并设计开发一套驱动软件框架以适配国产平台。该技术在飞腾1500A国产服务器上对卷积神经网络中的人脸识别与目标检测应用进行加速,运算性能较目前国产服务器运算能力提升30倍以上,实现自主可控的人工智能应用加速。
其他文献
给出一种基于C8051F020单片机的天线参数自动测量系统,该系统以C8051F020单片机为核心,由自动控制模块、信号采集模块、数据显示与存储模块三部分组成。从实验结果来看,设计
汉明码作为一种具有纠错功能的编码技术,在通信领域被广泛研究与应用。为降低水印提取的误码率,文中利用汉明码良好的纠错性能和均值量化的稳定性,提出一种基于汉明码的数字音频水印算法。首先将作为水印信号的二值信号进行汉明编码,并将编码后的汉明码矩阵利用Logistic映射加密,然后将原始音频数据小波变换,通过均值量化将加密后的汉明码嵌入到音频中。实验结果表明,该算法具有较好的透明性,对常规处理具有鲁棒性,
现代高等数学是我国大学中各个专业都必修的一门基础课程,它所包含的数学方法、数学思想以及数学思维不仅为大学生提供了学习其他课程的辅助工具,还对大学生创造能力的培养起到
由于信息化技术的更新速度之快和应用范围之广,工作效率大幅提升,服务理念和方式不断改变,工作和生活节奏不断加快,因此与世界各个角落的接触不再那么遥不可及。文中就OA办公
本文利用2008—2014年中国28个省份的高技术产业数据,运用固定效应模型实证分析了要素市场扭曲和制度质量对研发投入的影响,并将研究样本分为东部、中部和西部进行分地区回归