基于FPGA的异构计算研究及实现

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:hbjxwjy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着近年来人工智能、大数据等新兴事物的蓬勃发展,人们对高性能计算的需求大幅增加。尤其是人工智能的飞速发展,应用领域越来越广泛,应用场景越来越复杂,各种新型算法模型的快速迭代更新,对硬件计算能力的要求越来越高。传统的GPU设备计算性能优越,但是功耗问题日益严重,FPGA设备具有功耗低、能效高的特点,在加速计算领域有广阔的应用前景。传统FPGA开发流程长,开发门槛高,OpenCL标准的出现极大改善这一状况。矩阵乘法是经典矩阵处理算法,在气象预报、核子物理、深度学习中广泛应用,Squeeze Net神经网络模型是经典的小规模卷积神经网络,参数少,易于在FPGA上部署。因此本文基于FPGA异构平台,研究矩阵乘法、Squeeze Net模型的OpenCL加速实现。本文首先介绍异构计算和OpenCL标准相关知识,并根据FPGA架构特点,将本地内存考虑在内,建立适用于FPGA的性能分析数学模型。然后分析矩阵乘法、Squeeze Net模型的复杂度和计算并行性,给出提高计算并行性的设计思路。根据分析结果提出优化方案,对于矩阵乘法,采用分块计算的优化方法,将数据分块存入本地内存,以减少数据读取时间,利用性能分析模型得到设计的性能瓶颈在于DSP处理速度。对于Squeeze Net模型,设计通用卷积加速内核和池化加速内核,通过复用的方式实现整个网络模型,实现卷积运算时,先将卷积层的三维输入映射成二维输入矩阵,将卷积层的三维卷积运算转化为二维矩阵乘法,利用矩阵乘法的优化方法优化卷积运算,设计数据读取内核实现数据分块读取和存储,卷积内核从数据读取内核读取数据进行矩阵相乘运算,结果传给数据写入内核输出;实现池化运算时,展开池化计算循环,采用多输入并行的方法加速计算;利用性能分析模型得到卷积加速内核设计的瓶颈在于DSP处理速度,池化加速内核设计的瓶颈在于全局内存带宽。本文最后基于FPGA异构计算平台,使用OpenCL标准实现上述优化方案,并将结果与CPU、GPU平台进行比较。结果表明,制程落后的FPGA平台的性能功耗比最高,在矩阵乘法算法上表现是CPU的14.75倍,GPU的1.83倍,在Squeeze Net模型上的表现是CPU的10.48倍,GPU的1.12倍,说明FPGA平台具有比CPU、GPU平台更高的能效。
其他文献
民事诉讼当事人真实陈述义务在域外的立法中已经有了比较明确的规定,然而我国仅在新修订的《民诉证据规定》等司法解释中规定了该义务的某些方面内容,尚未在法律层面予以明确
在初中英语教学中,写作教学是英语教学的一个重要的组成部分。学生的英语写作能力也是综合语言能力的体现。义务教育英语课程标准(2011年版)对教学评价的建议是:英语课程评价体系应促进学生综合语言运用能力的发展。应使用多种最佳评价方法来评价学生的综合语言使用能力的发展水平。评价系统不仅应包括终结性评价,还应包括形成性评价。日常教学中的评价主要是形成性评价,重点是学生的学习成绩和学习过程中的进步。终结性评
高等学校公共体育课教学目标包括锻炼身体、增强体质;传授基本知识、基本技术和基本技能;进行思想品德教育三个方面。高等教育阶段是学生通过体育课的学习以形成正确体育观、塑造终身体育观的关键阶段,当前体育强国纲要对高校体育教育也有着较高的要求。因此,如何从根本上提高高校公共体育课的教学质量是多年来研究的重要课题。研究通过了解不同变量河南省普通高校公共体育课教师职业认同和教学效能感的现状,进一步探究两者之间
航空维修中的工具管理关系到航空维修的质量甚至飞行及人员安全。提高工具管理的智能化水平对航空事业的发展有着十分重要的意义。深度学习作为最先进的智能化方法代表,本文在深度学习的基础上对工具管理系统进行设计,将人脸识别、工具识别、字符识别三种图像识别技术应用到工具管理系统,并在QT上设计开发了工具管理界面。以下按顺序介绍本文所作的主要工作:1.介绍了深度学习的基本思想,及典型代表卷积神经网络CNN,凭借
沁水盆地南部樊庄区块煤层气开发低产井的比重越来越大,如何有效改善低产井现状、保持稳产成为亟待解决的问题。本文在系统分析樊庄区块影响煤层气直井低产关键因素的基础上,针对性设计了二次压裂改造方案,并进行了验证,为樊庄区块煤层气的稳产/增产提供了有力理论支撑。樊庄区块的主采煤层为山西组3#煤层和太原组15#煤层,均属于低孔低渗储层,渗透率总体呈现出随煤层埋藏深度增加而降低的趋势;低效井多分布在含气量相对
我国进入老龄化社会阶段,积极应对人口老龄化已成为全社会的共识。随着国民经济的快速发展,社会的价值取向也逐渐趋于开放多元,老年人对精神文化生活的需求逐渐上升,这实质上
目前在我国农村小学阶段,教师多学科教学已成为一种常态,一部分原因可能是农村教学资源短缺,学校不得不采取多学科教学的方式,另一部分原因可能是国家对农村小学教育越来越重视,提出要培养一批学识渊博、能力全面、热爱教育事业的且能够担任多学科教学任务的优秀教师,这就使得多学科教学成为农村小学教学中的主流。很多专家学者就农村小学教师多学科教学这一课题做了大量研究,给农村小学教师多学科教学提供了很多实质性帮助。
氢气作为一种能量载体不仅能量密度高、对环境友好。氢气还可以用来储存太阳能和风能等可再生能源所产生的电能。电解水是生产氢气的有效方法,摒弃传统工业产氢会排放二氧化碳等污染物的缺点,有望实现碳中性的方式大量产氢。目前,铂及铂基材料是最有效的降低电解水析氢反应(HER)中过电位的催化剂。然而,成本高昂、自然界储量少,限制了其实际应用。寻求地球储量丰富且经济成本低的非贵金属电催化剂取代成本高昂、自然界储量
随着人工智能的不断发展,人们对自动化设备的需求越来越高,自动驾驶技术逐渐引起人们的关注,其中车道线检测和交通标识的识别是环境感知中非常重要的组成部分,由于实际交通场景复杂、多变,使用传统方法对车道线和交通标识检测不能符合人们对自动驾驶技术的期望,随着近年来深度学习的不断兴起,通过在目标检测中引入深度学习,算法在复杂场景下也可以有优秀特征表现。为此,本文基于深度学习理论,对车道线检测和交通标识识别技
随着社会、经济发展的不断深化,新的风险也不断突显,例如疫情、火灾、自然灾害、境外敌对势力等等。面对突如其来的各类风险,突发事件的应急管理探索也显得尤为重要。本文通过理论结合实际,对宜宾市在加快建成全省经济副中心和建成长江生态第一城的进程中,对重、中型货车实施单双号限行而引发的货车司机集体罢运、集体信访突发事件应急管理案例的深入研究,总结出宜宾市在此次事件处理中应急管理方面采取的有效做法和成功经验,