高性能混合计算协处理器计算内核的研究与实现

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:YANYUGUOHOU
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
主处理器加协处理器方式组成的混合计算平台逐渐成为高性能和高效能计算的发展趋势。在典型的混合计算平台中,协处理器承担了主要计算加速任务。协处理器一般采用多核架构,内部按一定方式集成多个计算内核。本文介绍了混合计算系统及其协处理器ESCA芯片的体系结构和工作流程,在此基础上提出了适合ESCA芯片的计算内核体系结构和计算内核指令集。计算内核包括控制逻辑,存储单元和运算单元。对控制逻辑,研究了其指令译码和任务调度方式,以及向量模式、条件执行、精确中断等关键技术。对存储单元,设计了一个4读4写,支持容量扩展的4KB分体寄存器文件,重点研究了其中的读冲突仲裁机制。对运算单元,通过硬件共享的方式设计了一套支持子字并行的高性能运算单元,包括整型逻辑算术运算单元,整型乘累加单元,浮点融合乘累加单元等。运算单元支持丰富的运算类型,满足指令集的设计要求。本文最后对计算内核进行了功能验证,硬件评估和性能评估。分层次的验证策略保证了计算内核功能的正确性。在UMC0.18μm CMOS工艺下综合,控制逻辑,存储单元和运算单元分别占据计算内核14%,30%,56%的面积,表明计算内核具有控制简单,计算资源丰富的特点,适合多核集成。而对运算单元的评测结果显示计算内核以较小的额外硬件开销获得较大性能以及计算精确度的提升。
其他文献
目的 主要针对临床上初产妇在实施产前以及产后护理之后母乳分泌及喂养产生的影响进行了分析.方法 主要选择了我院在2017-2018年之间我院收治的100例初产妇作为主要研究对象,
包括人类基因组在内的近一百个物种的基因组测序已经基本完成。如何利用这些基因组的数据,对蛋白进行大规模的研究,已经成为现代生物学所面临的一个巨大挑战。目前蛋白质组学
随着无线通信技术的迅速发展,数据业务需求激增,频谱资源日益稀缺。为了提高频谱利用率,通信系统广泛采用各种非恒定包络调制方式,导致信号峰均比增大,从而使得对射频功率放
目的 分析对慢性心衰患者实施延续性护理的应用方法及疗效,探讨该护理干预对患者生活质量的影响.方法 回顾性分析我院2017年2月至2019年4月间收治的90例慢性心衰患者的临床资
Ⅱ型硫酯酶(TypeⅡ thioseterase,TEⅡ)是一种酰基-酰基载体蛋白(ACP)水解酶,其基因广泛存在于聚酮合酶(PKS)和非核糖体肽合成酶(NRPS)基因簇中。在PKS/NRPS合成过程中,TEⅡ的功能
卵母细胞发育调控是鱼类生殖生理学的重要核心内容。卵成活率的高低一直是评价水产养殖业的一个主要的客观因素,而卵母细胞最终成熟是卵子排出、成功受精的关键步骤。本研究采
目的 探讨脑梗死中医护理干预联合常规神经内科护理的价值.方法 选取2017年3月至2019年1月我院收治的68例脑梗死患者为研究对象,根据护理方式不同分为常规组(n=34)与复合组(n
目的 分析对妊娠晚期糖尿病患者在护理时应用循证护理的临床治疗效果.方法 选取本院2017年2月至2019年3月间接诊的82例妊娠晚期糖尿病患者为研究对象,随机数字抽签将其分为对
目的 探讨胃癌患者PICC置管并发深静脉血栓的护理措施和方法.方法 选取本院收治的60例胃癌患者为研究对象,行PICC置管,从年龄、肿瘤分期、导管尖端位置、导管留置时间四个方
目的 观察对比急性脑梗死合并糖尿病患者临床治疗采用个性化护理的效果.方法 选取我院2017年6月至2018年12月间我院收治的急性脑梗死合并糖尿病患者70例为本次研究对象.随机