基于多核处理器并行加速EDA算法研究

被引量 : 0次 | 上传用户:jamesleehp1111
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着集成电路工艺以及计算机体系结构的深入发展,受到功耗和散热的限制,单核处理器在工作频率上已达到极限,因此处理器逐渐向多核的方向发展。多核处理器是指在一枚处理器中集成多个完整的计算核心。典型的多核处理器有通用多核CPU、通用多核GPU和Cell BE等。不同类型的多核处理器由于各自不同的特点在不同领域得到了广泛的应用,通用CPU由于其独立的多个核心,在系统任务调度和复杂指令多线程方面得到了应用,通用GPU由于其针对图像处理优化的浮点运算和大规模并行核心,在数据密集型科学计算方面得到了应用,而Cell BE由于其异构架构在集群服务器上得到了应用。同时,与集成电路设计密切相关的EDA技术也在不断发展,.而EDA算法中存在大量的数据密集型计算,这些计算导致了EDA工具运行时间过长,对设计者的快速设计造成了不便。基于单核处理器的EDA算法受到单核处理器的工作频率限制,无法在运行速度上得到改善,因而迫切需要一种基于多核处理器的并行加速方法对EDA算法进行改进,以适应越来越广泛的多核处理器架构,在运行速度上得到提高。本文围绕面向数据密集型科学计算的多核处理器的体系结构及编程模型,提出通用CPU和通用GPU的异构串并行协同架构,针对数据密集型的EDA算法提出“热点”概念,寻找EDA算法中的“热点”,在CPU-GPU串并行架构上对“热点”进行并行化以对整个EDA算法进行加速。统计静态时序分析(SSTA)算法是一种典型的数据密集型计算EDA算法,传统的基于蒙特卡罗方法的SSTA由于随机配置数目过大,运行时间随分析电路规模的增大而快速增大,而本文基于稀疏网格法产生随机配置,减少了分析时的配置个数,并在此基础上基于GPU进行并行加速,与基于CPU的蒙特卡罗方法SSTA相比,获得了平均为320倍的加速比。针对硬件实现线性变换中存在的常数乘法器问题,本文设计并实现了一种可重配置多常数乘法器生成算法,可以在不同配置下实现不同组多常数乘法的输出。与已有的多常数乘法器和可重配置单常数乘法器相比,在面积上具有明显优势,在0.13μm工艺下,面积节省10%以上本文通过对可重配置多常数乘法器生成算法中数据密集计算部分的分析,基于GPU进行并行加速,获得了一定的加速比。
其他文献
家庭农场是一种新型的农业生产模式,其特点是以家庭为单位进行生产经营,同时能够通过规模化经营为农民增收,是一种符合我国农业现代化发展要求的农业生产模式。在如今全国各
科学技术的进步与发展不断改变着企业的经营和管理模式,但随着企业力量的日益壮大,它在给社会经济带来巨大发展同时,也给社会带来了一系列的问题:如漠视员工的利益;造成严重的
当前,中国特色的市场化道路步入了发展的快车道,粮食市场与宏观经济的相互关系也表现得更为复杂。本文尝试引入一种不基于任何函数关系假定前提的非线性检验模型,对1996—200
城轨列车运行线路及运行工况复杂多变,若用传统动力学模型,无法得到更为实用的研究结果。为此,建立六节编组城轨列车动力学模型,综合考虑制动工况以及城轨列车通过高架线路时
因子分析的元分析指对采用因子分析的原始研究进行分析,是知识生产和更新的重要一环,但尚未引起研究者的注意。主要有5种主要技术,即因子配对旋转法、多组验证性因子分析、基
目的:探索不同自立水平儿童自我延迟满足的注意机制及发展特点。方法:应用6-12岁儿童自立行为问卷对272名小学一年级学生的自立水平进行评定,根据儿童在自立行为问卷上的总分
学科文化建设是学科建设的重要内容之一,近年来国内高教理论与实践界对于高校学科文化建设进行了多方面的探讨,本文简要综述了这一理论与实践的现状、观点和有待深入探讨的问
我国是以煤为主要能源的国家,在煤长期开采过程中积累了大量的煤矸石,约占当年原煤产量的10%~15%。煤矸石是一种劣质廉价的燃料,含碳量较低,发热量偏低,热值一般为3000—1200
最近一段时期,在美国保守派关于“新冷战论”依旧频频出现在报纸网络上时,美国一些学者对于中俄关系也出现两种不同的看法。一种认为,中俄已经形成战略联盟,未来对美国将构成重大
报纸
如今,随着人们生活水平和生活质量的不断提高,人们在农产品消费方面也提出了越来越高的要求,不仅追求数量,也逐渐开始追求质量,从以往的追求"能吃饱"变为如今的"能吃好"、"能