【摘 要】
:
性能骨架分析技术通过刻画并行应用程序的程序结构,为并行应用程序性能建模提供输入,是大规模并行应用程序性能分析、性能优化的基础。文中针对数值模拟领域中的一类构件化并
【机 构】
:
北京应用物理与计算数学研究所,清华大学计算机科学与技术系,中国工程物理研究院研究生院
【基金项目】
:
科技部重点研发计划高性能计算重点专项课题(2017YFB0202103),国防基础科研核科学挑战专题项目(TZ2019002)。
论文部分内容阅读
性能骨架分析技术通过刻画并行应用程序的程序结构,为并行应用程序性能建模提供输入,是大规模并行应用程序性能分析、性能优化的基础。文中针对数值模拟领域中的一类构件化并行应用程序,在面向通用程序二进制文件的动静态结构分析技术的基础上,提出并实现了一种基于"构件-循环-调用"关系树(Component-Loop-Call-Tree, CLCT)的程序结构自动化生成方法,在此基础上,研制了一种面向构件化并行应用程序的性能骨架分析工具(CLCT SkeleTon Analysis Toolkit, CLCT-ST
其他文献
受制于核心技术和知识产权等客观条件,国产自主芯片的研发困难重重。RISC-V作为一个开源指令集架构(ISA),具有简洁、模块化等优点,成为了国产处理器的新选择。基础数学库作为
随着信息技术的高度发展,数据成为了重要的战略资源,如何利用大数据进行查询是众多学者的研究内容。与此同时,被查询对象在未被选择时,如何利用大数据使自己能够满足用户的查
虽然现有基于深度学习的图像阴影消除方法已取得了一定的进步,但是这些方法主要关注图像本身,没有很好地探索其他额外与阴影相关的信息,因此这些方法常常存在图像纹理模糊、内容不协调等问题。针对这些问题,文中基于生成对抗网络(Generative Adversarial Network, GAN),提出了一种新的阴影消除网络模型。该方法首先从全局上生成一个粗糙的阴影消除结果,再利用与阴影相关的残差信息对粗糙
问题生成是指机器主动对一段文本进行提问,生成一个自然语言的问题。神经问题生成则是完全采用端到端的训练方式,使用神经网络完成文档和答案到问题的转换,是自然语言处理中
近年来,随着数据挖掘和机器学习的兴起,基于时间序列分析方法的研究愈加丰富。作为机器学习的经典方法,KNN(K-Nearest Neighbor)因其简单、准确度高等特性被广泛应用于时间序
刀具磨损的智能监测是影响现代机械加工业智能化发展进程的重要因素。在机械加工过程中,大多数机床通过使用传感器采集信号,从而建立刀具磨损与传感器信号之间的关系,在不中
针对目前显著性目标检测算法中存在的特征融合不充分、模型较为冗余等问题,提出了一种基于全局引导渐进特征融合的轻量级显著性目标检测算法。首先,使用轻量特征提取网络MobileNetV3对图像提取不同层次的多尺度特征;然后对MobileNetV3提取的高层语义特征使用轻量级多尺度感受野增强模块以进一步增强其全局特征的表征力;最后设计渐进特征融合模块对多层多尺度特征自顶而下逐步融合,并采用常用的交叉熵损失
相比传统的图像识别方法,利用深度网络可以提取到表征能力更好的特征,从而获得更好的识别效果。现实中任务提供的数据多为无标签数据或部分有标签数据,其为深度网络的学习带来了困难。而迁移学习的方法可以将从源域数据中学习到的知识迁移到目标任务的学习中,以解决有标签数据不足的问题。为了在迁移过程中减小源域和目标域间的图像数据差异,文中提出基于深度动态联合自适应网络的图像识别方法。对网络进行训练时,首先在多层网
优化问题是工程领域常见的问题之一,大多数工程问题的本质是函数优化问题。金字塔演化策略(Pyramid Evolution Strategy, PES)在求解函数优化问题时虽然能够很好地建立种群"
区别于传统光纤传感器、图像识别和Kinect深度图像的旗语动作识别方法,提出了一种基于9轴姿态传感器的旗语动作识别方法。该方法通过佩戴在手腕处的9轴姿态传感器来采集旗语