基于采样的Chiplet互联结构模拟加速方法

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:q815034246
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
为了应对摩尔定律失效,芯粒(Chiplet)技术被提出。Chiplet需要使用片上网络(Network on Chip,NoC)互联,以实现大规模集成和高效通信。基于Chiplet的异构架构通常由不同功能、制程的模块互联而成,例如中央处理器(Central Processing Unit,CPU)与加速器的互联。然而,在面向Chiplet互联结构的模拟中,NoC比CPU等模块的功能模拟速度慢几十倍,即NoC的模拟速度制约了Chiplet整体的模拟速度。虽然现有采样方法可以加速NoC的模拟,但在如何精确采样出具有代表性的NoC轨迹(Trace)样本方面依然有待提升。传统的针对同构架构的采样方法基于等分间隔、等量流量分析的原理进行采样,无法模拟出基于Chiplet的异构架构中NoC的网络拥塞情况,导致了错误的NoC模拟结果。因此,如何对基于Chiplet的异构架构精确采样,并使NoC模拟精度和速度达到平衡成为了急需解决的问题。为了解决上述问题,针对基于Chiplet的CPU与加速器互联的异构架构,设计了基于TOPSIS(Technique for Order Preference by Similarity to an Ideal Solution)原理的Trace打分采样法(THTS)。针对Trace样本难以精确选择这一问题,THTS提出了利用分数衡量Trace代表性的样本选择策略。THTS通过选择准确、全面的打分指标,并基于TOPSIS原理对Trace进行打分,使得具有代表性较高的Trace分数较高,从而采样出分数大于阈值的Trace样本进行NoC模拟,实现了NoC模拟速度与精度的平衡。此外,设计了基于神经网络的权重探索模型,优化了打分方法中的指标权重,使得指标加权后的分数能更准确地衡量Trace的代表性。该模型能够根据输入的权重向量,快速预测出NoC的采样模拟结果,而无需进行真实的NoC采样模拟,从而加速了最优权重向量的求解过程。实验表明,相比于针对同构架构的NoCLabs采样方法,THTS在异构架构上进行采样的模拟结果更加准确。其中,平均数据包延迟误差降低了22.17%,平均减少了1.6倍的总模拟时间。THTS采样前后的平均数据包时间延迟误差控制0.05%~7.8%之间,提升了1.15~3倍的NoC模拟速度。此外,在不同的权重空间大小下,权重探索模型求解最优权重向量所需时间都在秒级以内,有效地加速了求解过程,并且最优权重下所预测的NoC模拟误差仅为1.42%。
其他文献
癫痫发作具有难治性、突发性和反复性的特点,对癫痫患者的日常生活和生命安全存在极大威胁。因此,及时对癫痫发作进行预警并采取干预,可以有效避免患者受到意外伤害。现有的癫痫发作预测方法存在两方面问题,一是特征提取方法对癫痫脑电信号的表征能力不足,提取的信号特征不够全面;二是特征分类方法普遍存在复杂度较高的问题,导致预测方法时延误差较大。为解决上述问题,设计了基于多视图特征的轻量级癫痫发作预测方法。针对现
学位
在数字技术加速与供应链融合的背景下,厘清数字技术赋能供应链的机制及效果是深入推进现代供应链体系建设的前提,对促进供给侧结构性改革和加快构建双循环新发展格局具有重要意义。借助供应链创新与应用试点工作构建的外生冲击环境,本文基于2013—2020年A股上市公司数据,系统考察了供应链数字化对企业绩效的影响。研究发现:供应链数字化显著提升了企业绩效,管理赋能和创新赋能是供应链数字化驱动企业绩效提升的具体路
期刊
三维点云分类算法能够有效提取三维数据的语义信息,在三维场景的语义理解方面发挥着重要作用,广泛应用于自动驾驶、机器人、虚拟现实等领域。目前基于原始点云的分类方法取得了不错的成绩,但现有方法在提取局部邻域信息时,未能充分利用邻域几何信息,并且在对局部邻域内各特征进行聚合时,存在特征信息丢失的问题。同时,现有方法在提取全局形状特征时,未充分挖掘点特征在语义层面的相关性,导致形状信息提取不充分。针对上述问
学位
以联邦学习为代表的协作学习框架,能在保护数据隐私的同时,深度挖掘多方医疗机构数据所蕴含的知识。在各方医疗数据质量良莠不齐的情况下,如何为协作学习选择可靠的参与方,提升深度学习模型性能,是多方医疗数据协作面临的重要挑战。现有方案主要通过计算参与方的数据贡献来反映数据质量,并进一步根据贡献阈值选择可靠参与方,存在两个问题:一是数据贡献计算指标单一,不能全面满足医疗领域模型性能评价的需求,二是难以制定统
学位
视觉问答是一个涉及图像和文本两种模态的任务,需要模型对图像和问题内容都有细粒度的理解能力,十分具有挑战性。视觉问答不仅在工业界有广泛应用场景,在拓展人工智能的边界上也具有重要意义。现有视觉问答算法普遍依赖于注意力机制,其中基于视觉-语言预训练模型的视觉问答算法是目前准确率最高的算法。然而,视觉问答任务和预训练模型中的预训练任务输入形式差异较大,同时视觉问答任务本身与预训练任务差异也较大,这限制了预
学位
数控机床加工过程的监测对保证工件质量和机床安全有着很高的现实意义。传统的基于力信号和振动信号监测方法有其局限性,近年来基于驱动电机电流信号的间接监测方法受到关注并取得了一定成效。但在机床切削负载较小条件下,传统的特征提取等处理方法无法很好地区分机床电流信号中噪音波动和加工状态变化带来的波动,并且切削负载较小时,仅选择主轴电流也不足以表征机床加工状态变化。如何选择合适的驱动电机电流也成为一大难题,不
学位
广域测量系统(Wide-Area Measurement System,WAMS)中提供的数据在如今的电力系统中已经有了诸多的应用,具有实时采集和上传等优良特征。然而,部分从相量测量单元(Phasor Measurement Unit,PMU)中采样得到的数据与WAMS数据中心汇总后得到的数据存在差异,实际获得的数据存在数据丢失、采样值偏差和跳变等的数据质量问题,形成不良数据,这些数据质量问题会使
学位
在图像合成或电影制作中,经常会有对目标物体的背景进行替换的需求。人像抠图是自然图像抠图领域中的子任务,该任务除了需要预测复杂图片中人物前景的不透明度外,还需要让预测达到发丝级的精度。在现有的大多数人像抠图算法中,遮罩的预测需要额外的三元图作为输入,并且具有较慢的推理速度,这使得算法难以在实时性应用中得到使用。目前,MODNet是一种无需额外输入,并兼具快速推理和精确预测能力的深度学习人像抠图模型。
学位
“刻地”是古籍版本著录的重要内容。文章从历史源流、中外学者论述、古籍编目标准化、学科发展等角度论述了著录“刻地”的必要性,参考四川省11家收藏单位的古籍普查数据和《中国古籍总目》的抽样数据,统计了其中的“刻地”著录比例,了解了当前古籍编目中“刻地”著录的实际状况。文章以清代四川刻本为实例,提出鉴定与考证“刻地”的具体方法,并对考证过程中容易出现的错误因素进行了举例说明。
期刊
随着大数据时代的到来,金融行业依托互联网实现飞速发展,产生了海量金融文本信息,人们开始通过实体抽取和关系抽取技术自动从非结构化金融文本中提取有价值的信息,为构建金融问答系统、知识图谱等提供数据基础。在构建实体抽取和关系抽取模型时,存在文本中的实体对上下文的长距离依赖、实体抽取结果未被关系抽取模型有效利用的问题,此外由于金融文本的特性,还存在嵌套实体实例多、复杂关系类型分布广泛的问题,增加了面向金融
学位