国产申威架构上多核排序算法的设计与实现

来源 :山东大学 | 被引量 : 0次 | 上传用户:iswhat
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在大数据时代下,如何对海量数据进行高效的分析已成为我们亟需解决的问题,其中对数据排序是处理海量数据的关键步骤。排序算法一直以来都是计算机科学领域中探讨最为广泛的问题之一,同时该算法也是许多应用科学和工程应用的关键组成部分。伴随着排序算法的研究不断向前,现在已有许多效率较高的排序算法实现,但是这些排序算法往往适用于特定的平台或处理器,又或者是它们无法在合理时间内完成对大规模数据排序的任务。又随着多核异构体系的出现,当今许多超级计算机的处理器中往往存在多个计算核心和管理核心,它们可以实现精细地数据级、线程级并行优化,从而提高程序的整体性能。而多核排序算法的设计通常具有负载不均衡、访存次数多以及并行程度低等难点,并且目前国产申威架构上没有高效的多核排序算法,因此在国产申威架构上设计和实现高效多核排序算法的需求十分迫切。针对以上难点和挑战,本文的目标是在国产申威架构上设计和实现高效的多核排序算法库。本文的主要工作有以下几个方面:1.设计和实现了国产申威架构SW26010处理器的单核排序算法。在国产申威SW26010处理器的单核排序算法中,本文设计和实现了向量化的双调排序网络以实现数据级并行,其中该排序网络主要包括向量化的相同通道排序算法、向量化的矩阵转置算法、向量化的双调归并算法和向量化的归并有序列表算法;2.设计和实现了国产申威架构SW26010处理器的多核排序算法。在国产申威SW26010处理器的多核排序算法中,本文设计和实现了两种归并排序框架以实现线程级并行,分别为基于寄存器通信的多核归并排序框架和基于满二叉树的多核归并排序框架,同时本文对两种归并排序框架进行了比较选择;3.将本文设计的多核排序算法swSort同其它排序算法进行了比较。通过使用排序时间、排序效率、加速效果等指标,本文分析并得出以下结论:1.对于单精度浮点数排序,swSort可在5s时间内对至多5亿个单精度浮点数实现排序,并且排序效率集中在每秒钟排9.5 × 107至12.7 × 107个单精度浮点数。而在加速效果方面,swSort相比于Intel平台上实现的AVX256版排序算法可以取得2~3倍的加速效果,相比于主核调用C标准库qsort的方法可以取得73~205倍的加速效果;2.对于双精度浮点数排序,swSort可在5s时间内对至多2亿个双精度浮点数实现排序,并且在不同规模的浮点数排序中具有更好的加速效果和更可靠的稳定性,排序效率可以实现每秒钟排6 × 107至8.8 × 107个双精度浮点数,相比于主核调用C标准库qsort的方法可以取得最高74倍的加速效果。总之,本文在国产申威架构上设计并实现的多核排序算法在排序方面具有良好的性能表现。
其他文献
本研究聚焦同声传译中的错误感知。过往研究很少对比考察接受过口译培训的专业译员和没有口译知识的普通听众对同传错误的感知。本文将科勒拉多斯(Collados Ais)模拟口译的口译质量评估理论以及迪林杰(Dillinger)的“专家-新手听众”理论进行结合,尝试从新的研究角度,即两组不同同传听众对同传译员错误的感知,来分析同传质量评估。第一组是接受过培训的专业口译员,另一组不了解也从来没有接触过口译。
学位
2014年10月,国务院发布了《关于加快发展体育产业促进体育消费的若干意见》(国发[2014]46号)将全民健身上升为国家战略。2022年3月,中办、国办印发《关于构建更高水平的全民健身公共服务体系的意见》指出,到2025年,将基本建立更高水平的全民健身公共服务体系,人均体育场地面积将达到2.6平方米。全民健身场地设施是全民健身物质基础。自从体育彩票发行以来,体育彩票公益金为我国全民健身场地设施建
学位
秦腔作为真正具有民间性的俗文学艺术,是秦地人民精神领域的一面多棱镜,它反映了居住在西北这片广袤土地上的人民最深层的性格特质。秦人尚武重义的传统与三国故事的精神经过深度融合,形成了久唱不衰的秦腔三国戏。本文立足现存秦腔三国戏剧本,拟从剧本梳理、人物形象及思想意蕴分析、艺术特质考察和剧本文学的民间性四个方面,探析秦腔三国戏剧本的戏剧性和文学性,深掘秦腔三国戏剧本中隐含的思想基础和民间伦理。第一章为秦腔
学位
19世纪的欧洲兴起了一股东亚热,西方资本主义国家对东亚国家尤其是中国产生了浓厚的兴趣。在这样的历史背景下,加拿大传教士芮哈特(Susie Carson Rijnhart,1868-1908,亦译为瑞吉纳特,中文名凌苏珊)来到中国,致力于康藏地区的基督教传教事业。本文以芮哈特为研究对象,采用文献研究法、比较研究法和跨学科研究法等方法对康藏地区的自然环境和社会环境进行介绍,梳理其从甘南到川康的传教踪迹
学位
经费是高等教育发展最直接的物质基础,尽管高等教育经费投入在不断增加,但在我国经济高速发展的背景下,大学的经费结构也必然发生相应的调整和变化,以更好适应高等教育的发展。随着《高等学校信息公开办法》的出台,我国高校陆续公开了财务信息的决算报告,这为研究双一流大学经费结构对办学绩效的影响提供了数据依据。首先,研究收集了2015-2020年32所双一流大学财政年度决算报告,就得到的经费数据分层次进行了分析
学位
少北拳是我国传统武术百花园中的一朵奇葩,是中华优秀传统文化中的一颗耀眼宝石。据《少北拳法源流考》遗墨考证,少北拳源流系明末清初临济武僧觉空与山东张大奇二师所传,历经六代传承至辽宁锦州张荣时。1996年国家体委专家组根据“源流有序、拳理明晰、风格独特、自成体系”的评定原则,认为“少北拳为源于少林而又有创新且别于少林的一个拳种”。至此,少北拳成为我国传统武术大家庭中正式一门派。张荣时先生是少北拳的创始
学位
本文旨在研究政府译员汉英交替传译中的明晰化现象,基于唐芳、李德超提出的明晰化定义及分类,将2021年总理记者会中英交传中的明晰化案例进行编码、编项并归类,将所有明晰化案例分为三大类:经验明晰化、人际明晰化及语篇明晰化以及十小类,描述各类明晰化的特征,并结合系统功能语言学中语言的三大元功能理论解释这些特征,从而更好地了解政府译员中英交传的明晰化特征及原因。研究发现,明晰化特征如下:大类中,经验明晰化
学位
戏曲艺术是中国特有的艺术文化,凝结了中华民族五千多年的艺术结晶。其中,京剧艺术不仅有着“国粹”之称,同时也具有相当广泛的流传度。然而,随着科技的快速发展与信息的不断更替,各种紧随时代潮流的艺术形式应运而生,传统京剧艺术逐渐演变为小众艺术。而大数据时代的到来,让京剧艺术在面临传统文化资源保存与传承等问题的同时也迎来了一丝转机。信息可视化设计作为一种同时兼具数据技术与艺术美感的设计门类,能够更好的将传
学位
课堂教学语言是思政教师在课堂上传递知识、表情达意、师生互动的工具,熟练运用教学语言可以提升思政课的教学效果,促进思政课堂的改革创新。《普通高中思想政治课程标准》(2017年版2020年修订)对高中思政课的教学提出了新的指导要求。全文以高中思政课课堂教学语言为起点,围绕着“是什么、为什么、怎么做”三步骤的研究顺序展开,其目的在于对高中思政课课堂教学语言的优化寻找到行之有效的解决途径,助推高中思政课建
学位
在我国快速城市化进程中,外出务工浪潮导致大量农村留守儿童的父母渐渐疏于对孩子的照顾,造成农村留守儿童生长发育迟缓、饮食营养结构不合理、健康常识知识缺乏、疾病预防与救治困难、容易产生心理疾病等问题不容乐观,加之临时监护人自身健康医疗知识匮乏,使得农村留守儿童在健康医疗方面存在诸多问题,其身心健康发展变得愈发不利。随着智慧医疗的应用范围不断扩大,通过大数据、物联网等信息技术整合城乡医疗资源,实现跨区域
学位