【摘 要】
:
在众核DSP中挖掘并行应用程序的并行性和追求更高的性能需要高效的DSP核间同步机制。传统的信号灯同步机制,基于“忙—等待”机制的旋转锁通过持续不断的请求同步变量来保证互斥性,这会在处理器节点之间产生严重的通信延迟,进而在片上网络中产生较大的网络流量,导致严重的网络竞争。栅栏同步机制的特点是全局性,体现在它需要多个处理器核共同参与。但是栅栏同步机制的全局性容易导致严重的串行化,进而对系统性能产生很坏
论文部分内容阅读
在众核DSP中挖掘并行应用程序的并行性和追求更高的性能需要高效的DSP核间同步机制。传统的信号灯同步机制,基于“忙—等待”机制的旋转锁通过持续不断的请求同步变量来保证互斥性,这会在处理器节点之间产生严重的通信延迟,进而在片上网络中产生较大的网络流量,导致严重的网络竞争。栅栏同步机制的特点是全局性,体现在它需要多个处理器核共同参与。但是栅栏同步机制的全局性容易导致严重的串行化,进而对系统性能产生很坏的影响。因此如何提供高效的同步机制以便能充分挖掘众核处理器的并行性能,已经成为众核体系结构设计领域的重要课题。本次设计提出了一种众核DSP层次化栅栏同步方案,并开展了硬件设计与实现。本文研究工作如下:首先分析了当前处理器发展趋势与挑战,介绍了目前已有的几种同步机制,结合X DSP的体系结构特点,设计层次化栅栏同步方案,包括超节点内栅栏同步单元与超节点间栅栏同步单元,用以实现X DSP众核间的快速同步。其次,完成层次化栅栏同步方案的实现,即超节点内栅栏同步单元与超节点间栅栏同步单元的设计。其中超节点内栅栏同步单元主要负责完成超节点内的2-4个DSP核的快速同步,根据栅栏编号,将4个DSP的同步请求分发到不同的栅栏进行处理,对栅栏请求进行同步化处理,并产生DSP暂停信号和异常信号;超节点间栅栏同步单元主要负责6个超节点间的快速同步,包括地址译码,逻辑判断以及同步变量操作中心三个模块,其中地址译码模块根据地址进行译码,产生相应的栅栏操作类型与同步操作数据;逻辑判断主要是判断栅栏操作是否有效,并且发送到同步变量操作中心;同步变量操作中心则是对同步单元的控制寄存器或者栅栏实例寄存器的访问,产生最终的栅栏释放信号。并在此基础上完成层次化栅栏同步单元的RTL代码。接着,针对设计的各个单元提取验证功能点,通过verilog测试激励完成对超节点间同步单元内部功能的模块级验证;由于超节点内同步单元模块与外部模块具有互动信号,因此接着进行该模块的系统级验证,以确保设计的正确性与完整性。最后,对同步单元进行性能评估。通过综合激励对基于层次化栅栏结构的众核DSP同步技术的有效性及对其性能进行定性定量地分析,验证与评估。在某厂家40nm工艺条件下,设置工作条件为Worst,输入延迟为0.05ns,输出延迟为0.1ns,时钟约束设置为0.35ns,超节点内栅栏同步单元综合后的面积约为4487.62 um~2,功耗约为3.12mw;超节点间栅栏同步单元综合后的面积约为2556.62 um~2,功耗约为1.42mw。
其他文献
随着分布式电源的不断接入,可控负荷的不断增多,本文以含风、光等出力具有波动性的分布式电源为研究重点,对含分布式电源的配电网孤岛划分及多故障修复策略进行研究,目的在于提高电力系统的供电安全性和提高能源的利用率。本文主要进行的研究工作如下:首先,本文系统介绍了含分布式电源的配电网的孤岛划分及多故障修复策略研究的相关理论、发展现状和课题研究的意义,详细介绍了各种分布式电源的特点,分析了当分布式电源接入配
随着重载列车轴重、速度和运行密度的不断提高,导致钢轨侧磨和剥离掉块等伤损日益严重,尤其是小半径曲线钢轨病害、钢轨焊接质量等一直是影响重载安全运输的关键。既有研究表明,钢轨的磨耗和剥离掉块与钢轨的强度和硬度有着直接的关系,本文以具有典型重载运输模式的朔黄铁路为背景,针对一种新型材质高强度过共析钢轨75N-PG5在重载线路上的应用性能进行研究。通过分析钢轨的化学成分、性能及焊接质量,实测焊接接头的平直
稻谷作为我国的战略储备粮之一,其存储时间通常为1-3年。在稻谷储藏过程中,霉变是造成稻谷损失的原因之一。危害真菌孢子计数法是对霉变进行早期监测的一种手段,通常这种方法需要人工在显微镜下观察真菌孢子,费时费力。本文提出了一种基于深度学习的真菌孢子检测算法,实现了在显微图像中对真菌孢子的自动定位和识别。本文主要完成了以下几个方面的工作:(1)本文建立了真菌孢子显微图像数据集。数据集中包含三类真菌孢子图
近年来,我国农村和城市地区都有违法建筑滋长,治理违法建筑已成为行政机关一段时间内的工作重点,妥善处理违法建筑拆除行政纠纷也成为司法机关的工作难点,与此相关的法律问题
粒子群算法是典型的群智能算法,由于算法的高效性和易实现性成为了研究热点。目前粒子群算法已经被广泛应用到函数优化和工程技术领域,并取得了诸多成果。但是,粒子群算法的研究还处于初级阶段,算法本身存在一些不足之处。旅行商问题是一种经典的、受到广泛关注的组合优化问题。迄今为止,旅行商问题已经有多种不同的求解方法被提出。粒子群算法也被尝试解决旅行商问题,并取得了一定成果。然而,算法在求解质量上仍然存在一些不
随着物质条件的提高,人们对精神层次的追求有所提升,运动成为了人们喜爱的一种休闲方式。跆拳道以其独特的魅力深受人们的喜爱,但跆拳道在我国的发展尚且处于初级阶段,要经过一定的时间和过程才能够被更多的人认识、接受。随着学习跆拳道人数的增加,跆拳道俱乐部的规模也越来越大,在经营管理过程中面临的困难逐渐增多,如果不进行消费引导,市场也会发生紊乱。通过对周口市跆拳道俱乐部不同运营模式下的经营管理结构进行调查研
在城市的基础设施中,地下管线起着关键性的作用,它是城市的血脉,是现今城市发展的基础。如今的地下管线已是密密麻麻、错综复杂,给管线的统一管理以及进一步的修建带来很大的
知识经济时代加剧了科技变革和国际竞争,由此引发各国对21世纪人才核心素质的重新思考。目前,许多国家的人才培养重点已从掌握专业知识和技能的基本要求,转向处理复杂任务和信息的思维方式训练。而在高等教育中引导学生从记忆、理解知识的低阶思维,转向分析、综合、评价各类信息的高阶思维是新时代创新教学模式、提升人才素养的重要环节。因此,探讨促进大学生高阶思维发展的教学策略,有助于发挥高校在国家教学改革研究中的主
亚洲大陆中国、朝鲜半岛韩国和日本列岛的日本国,在祖先们共同努力下所开拓的航路,使各国的文明得到了交流。所构成的东亚贸易圈,依托于航海的发展与发达,才能实现各民族之间
目的:右美托咪定作为麻醉诱导期的辅助用药,常与舒芬太尼一起用于缓解气管插管所诱发的伤害性应激反应,为确定两种药物的剂量反应关系,本研究应用反应曲面法,构建麻醉诱导期右美托咪定与舒芬太尼抑制气管插管反应的药效学相互作用模型,从而探索两种药物联合使用时的量效关系。方法:预计纳入120例拟在全身麻醉下行妇科手术的病人。模拟slice研究设计,每例病人随机接受不同剂量的右美托咪定(01.1μg/kg)和舒