面向深度学习的SoC架构设计与仿真

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户：qwer2

【摘要】

：

随着互联网技术的蓬勃发展、信息量的爆炸式增长以及深度学习技术研究和应用的普及，人们对于计算能力的需求不断提高。在传统通用计算已逐渐无力应对大规模、高并发计算需求的

【作者】

：

崔浩然

【机构】

：

中国科学院大学

【出处】

：

中国科学院大学

【发表日期】

：

2018年期

【关键词】

：

深度学习异构加速结构系统级芯片仿真建模

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术的蓬勃发展、信息量的爆炸式增长以及深度学习技术研究和应用的普及，人们对于计算能力的需求不断提高。在传统通用计算已逐渐无力应对大规模、高并发计算需求的情况下，异构计算能够为深度学习释放更强的计算能力，达到更高的性能要求，并可应用于更广阔的计算场景。本文通过对目前主流的深度学习算法等进行分析，针对性的设计了一个面向深度学习的异构加速结构。　　本文的主要研究内容和贡献包括:　　算法特征分析与提取。通过对目前常用的深度学习算法，如GoogleNet、VGG、SSD算法分析其计算特征，将多种深度学习算法归纳为有限个拥有不同计算特征的深度学习共性算子类，通过图表及结构框图的形式展示出来，同时生成最小算子级别的伪指令流。　　通用SoC仿真建模平台的搭建。对通常组成SoC平台所需要的组件进行仿真建模，得到一个SoC模拟器的仿真平台，可以对任意SoC系统进行事务级的仿真，计算性能参数，功耗等SoC系统评估必需的结果。　　异构计算平台的SoC架构设计。可以实现对多种深度学习算法进行硬件加速，例如GoogleNet、SSD等。根据算法特征分析与提取，进行面向深度学习的硬件加速AI IP核的设计，构建整个异构计算平台的SoC架构，并通过仿真建模平台进行实验验证。SoC系统的性能功耗比大于1.5TOPS/W，可以通过GoogleNet算法对10路1080p30fps视频逐帧处理，每帧端到端的处理时间≤30ms。

其他文献

基于动态虚拟夹具的机器人遥操作系统

随着机器人研究的深入和机器人领域的拓展，许多恶劣、危险环境下的作业，都需要由作机器人完成。这些作业一般都比较复杂，由于受机器人技术水平的限制，目前机器人很难自主完成这些

学位

机器人机器人遥操作系统遥操作系统动态虚拟夹具动态虚拟夹具碰撞检测碰撞检测数学模型数学模型导引控制策略导引控制策略

基于InCoME的软件成本估算方法及支撑工具

软件成本估算领域经过四十余年的发展，涌现出一大批估算理论与方法，但都没有在现实环境中的软件企业中得到广泛应用，在项目早期进行软件成本估算仍旧是一件非常难的任务。由于估

学位

软件成本估算方法支撑工具软件企业

动态社会网络中的社区推荐算法研究

社会网络分析（Social Network Analysis，SNA）是使用量化方法对社会网络进行分析，研究其中个体和网络特性的学科。近年来，随着Internet的发展，大量社会网络数据的出现，尤其是由网络行

学位

数据挖掘数据挖掘机器学习机器学习社会网络分析社会网络分析社区识别社区识别社区推荐算法社区推荐算法

逆向工程中点云数据简化与曲面重建技术研究

逆向工程以其在产品设计和研发中的独特优势,得到了广泛的研究和应用。作为其中的两项关键技术,点云数据简化和曲面重建具有重要研究价值。如何有效地缩减点云数据的规模并在

学位

逆向工程点云数据曲面重建几何特征径向基函数

ICRH天馈线远程控制与状态检测

ICRH(Ion Cyclotron Resonance Heating)天馈线远程控制与状态检测系统是EAST-ICRH控制子系统之一。基于FPGA的天馈线远程控制与状态检测系统实现解决了新型ICRH天线和传输系

学位

ICRH天线天馈系统同轴切换状态监测SOPC串口通信

RFID系统中的UHF频段多协议兼容防冲突算法的研究

射频识别(RFID)是一种利用无线射频的远距离通信方式实现的非接触式的自动识别技术,和其它识别系统相比较具有速度快、实时性强、采集准确性高等优点。随着技术的发展,RFID系

学位

多协议兼容射频识别UHF频段防冲突算法

基于BP神经网络的语音识别研究

语音识别技术具有重要的理论价值和广阔的应用前景，近年来受到了人们的广泛重视。随着电子计算机的不断应用与发展以及人工智能的不断进步与完善，人们越来越希望让机器能够理解

学位

语音识别语音识别BP神经网络BP神经网络特征提取特征提取视频检索视频检索隐马尔可夫模型隐马尔可夫模型

KAD DHT的网络特征与节点行为的测量研究

近年来，关于分布式哈希表(DHT)的研究非常多，有通过模拟仿真、理论分析等方法的，也有从实际测量角度出发的。eMule中基于Kademlia算法的KAD网络是当前最大规模的DHT实现，任何时刻

学位

网络特征节点行为KAD网络空间分布

基于强化学习的文本语义匹配

随着计算机和互联网的飞速发展，互联网的信息量呈现爆炸式增长。信息量的增加既为人们的生活带来了便捷，也给人们提出了巨大的挑战。在海量的信息面前如何高效的获取信息以及如

学位

文本匹配语义信息强化学习马尔科夫决策过程蒙特卡罗树搜索

Bighive：一个针对时间维度优化的分布式结构化数据存储系统

“中国Web信息博物馆”(Web InfoMall)，是一个针对中国互联网信息的搜集、存储与历史浏览服务的海量信息系统，5年来已经积累超过25亿中国互联网上出现过的网页，数据量已经超过30

学位

分布式结构数据存储系统数据访问时间维度优化

面向深度学习的SoC架构设计与仿真

与本文相关的学术论文