【摘 要】
:
This article presents a comprehensive performance evaluation of Phytium 2000+,an ARMv8-based 64-core architecture.We focus on the cache and memory subsystems,an
【机 构】
:
College of Computer,National University of Defense Technology,Changsha 410073,China
论文部分内容阅读
This article presents a comprehensive performance evaluation of Phytium 2000+,an ARMv8-based 64-core architecture.We focus on the cache and memory subsystems,analyzing the characteristics that impact the high-performance computing applications.We provide insights into the memory-relevant performance behaviours of the Phytium 2000+system through micro-benchmarking.With the help of the well-known roofline model,we analyze the Phytium 2000+system,taking both memory accesses and computations into account.Based on the knowledge gained from these micro-benchmarks,we evaluate two applications and use them to assess the capabilities of the Phytium 2000+system.The results show that the ARMv8-based many-core system is capable of delivering high performance for a wide range of scientific kernels.
其他文献
针对水下图像模糊、对比度低且色彩失真的问题,结合修正的水下成像模型,提出一种基于场景深度估计的自然光照水下图像增强方法.首先,依据自然光照条件下水下图像场景亮度与场景深度总体成正比的先验理论,对图像的亮度信息进行最小值滤波和软抠图处理以实现场景深度估计;然后,结合暗通道先验知识和场景深度信息进行离散像素点的后向散射分量估计,根据修正的水下成像模型来拟合和去除后向散射;最后,采用基于色适应的颜色校正
综述了单目相机重定位的研究现状和最新进展,介绍了该领域的关键方法.不同于现有对重定位方法进行纵向分类的方式,本文提出了一种从场景模型构建、环境信息匹配、相机位姿解算3个方面进行展开的直观、统一的横向视觉定位结构体系,在该体系中基于深度学习以及基于几何结构的视觉重定位方法首次被统一地对比阐述.基于深入的性能分析讨论和可视化结果,指出了目前该领域导致性能瓶颈的因素和仍然存在的挑战,并对当前性能优越的相
针对复杂情况下视觉目标跟踪算法性能严重退化的问题,提出一种基于难例挖掘和自适应时间正则化的视觉目标跟踪算法.首先,该算法在Staple算法基础上,深度挖掘困难负样本用于相关滤波器训练,提高了跟踪算法的抗干扰能力;其次,加入自适应时间正则化约束,根据目标响应图的变化情况,自适应确定时间正则化系数及模型更新策略,增强了跟踪算法的鉴别能力.在数据集OTB-2015、TC-128和UAV123上的实验结果
目的利用小型猪房间隔缺损模型探讨新型国产房间隔外科生物补片的安全性和有效性。方法2018年6月至2019年4月,26只健康中华小型猪随机分为实验组(15只)和对照组(11只),通过传统外科方法建立房间隔缺损动物模型,实验组和对照组分别采用待评价的和已上市的内径10 mm 圆形生物补片修补房间隔缺损。记录两组术前和术后7、30、90、180 d的超声心动图和血液学检查结果;于术后90和180 d处死
It is our great pleasure to announce the publication of this special section in Journal of Computer Science and Technology(JCST),Memory-Centric System Research
目前的2D/3D医学图像配准方法的配准精度和效率存在矛盾,配准捕获范围小.为解决这些问题,本文提出一种基于主方向傅里叶变换算子的分级配准方法.首先,提出平面旋转平移不变性算子——主方向傅里叶变换算子.然后,提出基于主方向傅里叶变换算子的模板匹配初始化方法,可避免接近真值的初值需求,并显著扩大了捕获范围.最后,提出基于主方向傅里叶变换算子的分级配准框架,将配准搜索空间从O(n~6)降到O(n~2),
为了获取柔性关节精确的物理参数,提出了一种基于系统谐振与抗谐振特性的参数辨识方法.首先建立柔性关节的数学模型,利用该模型推导柔性关节的谐振、抗谐振频率特性与待辨识参数的数学关系,然后基于此关系建立误差回归模型,设计实验采集不同负载条件下的输入与输出数据,计算得到系统的谐振、抗谐振频率及幅值,代入回归模型并基于最小二乘法求解参数.最后,通过仿真与实验将本文方法与一般的频域特性拟合方法进行对比,结果表明在含有噪声的情况下本文方法将参数辨识平均精度从75.34%提高到90.35%,方差从25.34%降低到8.0
研究并设计了一种基于服务机器人云平台的故障诊断系统.传统算法只关注服务机器人某一时刻的状态数据,所提取的特征信息有限,因而难以较好地完成故障诊断任务.在这种背景下,提出了基于时间序列关联特征的故障诊断方法.首先,对采集的服务机器人数据进行归一化和后向差分预处理,消除数据量纲并获取数据变化特征;其次,利用滑动窗口来生成时间序列样本,保证每个样本包含足够的特征信息;然后,应用卷积神经网络(CNN)挖掘时间序列的关联特征,并在网络中引入通道注意力网络(squeeze-and-excitation network
目的本研究通过RA真实世界的大规模研究旨在比较中国RA血清阳性和血清阴性患者临床特征和预后。方法纳入2015年9月至2020年1月于全国10家医院就诊的符合1987年ACR分类标准或2010年ACR/ELUAR RA分类标准的RA患者。根据血清学状态,将患者分为4个亚组[RF(-)抗CCP抗体(-)、RF(+)抗CCP抗体(+)、RF(+)抗CCP抗体(-)、RF(-)抗CCP抗体(+)],并比较
目的探讨高度近视眼黄斑劈裂患者的黄斑区脉络膜容积(MCV)的特征及其临床意义。方法横断面研究。纳入2016年1月至2020年12月于北京大学人民医院眼科门诊就诊的39例(39只眼)高度近视眼黄斑劈裂患者作为黄斑劈裂组,年龄(59.3±6.7)岁,其中男性18例,女性21例;选取年龄、性别、屈光度数匹配但无黄斑并发症的高度近视眼患者39例(39只眼)作为对照组。收集两组患者屈光度数、眼轴长度和最佳矫