基于AWS云平台GPU集群加速的Apriori算法的研究和应用

被引量 : 0次 | 上传用户:ontrackfor19888
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
健康和疾病防控对每一个人都很重要,而大数据时代的到来,给生命科学和健康领域带来了机遇和挑战。对医疗数据的合理挖掘和使用,将发现临床症状、生活习惯、遗传等等因素和疾病之间的关联和规律。这将在临床辅助决策、疾病预测、个性化治疗等等领域起着决定性作用。Apriori算法是数据挖掘中最经典也是最常用的算法之一,然而对于海量规模的数据,数据挖掘所需要的计算量也迅速膨胀,Apriori算法过程变得十分耗时,很难满足人们的需求。如何加速Apriori算法效率,快速地从海量医疗数据中挖掘出有用的关联规则是一个需要解决的问题。传统的计算机集群技术可以很好的提高算法的效率并且具有较好的可扩展性,但是其过于高昂的成本以及复杂的架构使得其使用范围极其有限。相对于CPU来说,GPU有着更多的执行单元,使得GPU有着高性能的并行计算能力。通过GPU的并行计算能力的使用可以在成本较低的情况下得到较好的加速效果,但是主机中显卡数目的限制使得它可扩展性不高,很难应对应用需求越来越大的计算量。亚马逊云平台允许用户通过低廉的租用成本来使用海量的云计算资源,基于此,提出一种基于亚马逊云平台GPU集群加速的Apriori算法,该方法通过按需计费的方式来使用亚马逊的云计算资源,成本低廉;GPU实例中的G2实例包含高性能的NVIDIA GPU,具有很强的并行计算能力,可以带来良好的加速效果;亚马逊云服务提供弹性的计算能力,具有良好的可扩展性,可以应对应用的弹性需求。通过对Apriori算法的分析和并行化设计,提出了基于AWS云平台GPU集群的Apriori算法。其中解决了AWS中GPU集群的通信设计和搭建、数值型数据离散化和频繁项集的表示、Apriori算法的多节点多线程的并行设计、基于CUDA存储器模型的存储优化设计等一系列问题。通过实验得知,该算法具有较好的加速效果、较高的可扩展性,并且成本更加低廉。利用该算法,初步完成了一个乳腺癌疾病诊断应用,并取得了较好的效果。证实了本算法在大数据医疗中的可行性,为医疗领域中小企业和个人研究人员提供了一种低成本、高效率的解决方案。
其他文献
为加快扁桃产业的发展进程,对引进于美国、意大利等国的20余个扁桃良种的物候期、开花授粉特性、光合特性、抗逆性等性状特性进行了试验与调查,同时就栽培技术措施对其丰产优
有关农业、农村和农民的“三农”问题,始终是中国现代化优先要解决好的战略性命题。毋庸置疑,中国是一个历史悠久、具有东亚典型传统农耕文明特色的农业大国。在以工业化、城市
SPOC(小规模限制性网络课程)作为对MOOC(大规模开放式网络课程)的创新,将MOOC资源与本地化校园课堂教学深度融合,实现优势互补,以提升教学质量.以应用型本科高校-安徽三联学院“
<正>秋季,正是石榴收获的季节。石榴汁多,酸甜爽口,有"御饥疗渴,解酲止醉"之功。除鲜食外,如加工成清凉饮料或酿酒造醋,则滋味独特,别具风格。据分析,石榴果实含鞣质、糖类、
目前,大面积功能性表面纳米结构和纳米结构涂层能够极大的提高产品性能和改进产品的品质,特别是太阳能电池板、抗反射和自清洁玻璃以及新一代大尺寸高清平板显示等行业对于超
为了研究厚松散层条件下煤矿开采沉陷盆地边界的界定及其影响因素,基于现场实测资料和误差传播定律,建立了厚含水松散层条件下地表沉陷监测点点位中误差函数模型;以辛置煤矿
目的分析小儿静脉留置针使用过程中的风险因素,并提出对策。方法对960例使用外周静脉留置针的患儿实施风险管理。结果通过实施风险管理,小儿外周静脉留置针的风险事件发生率
伴随着全球经济和文化交流的日益深入,国际之间的交流也更加频繁,而电影作为各国文化交流的一个载体,在其中发挥了愈加重要的作用,同时电影的字幕翻译也成为实现各国语言和文化交
<正>多年前,我体检时查出有胆结石,虽然医生说结石不大可暂时不用手术,平时多喝水就是。最近,母亲在乡亲那里得来一药方:玉米须、芦根各30克,茵陈15克,每日1剂,水煎服。这样
现代科学技术的迅猛发展,和信息时代的来临,信息技术在现代社会中扮演者重要的角色,这为现代企业发展带来了强大的动力。然而,机遇来临的时候也伴随着挑战,为了适应信息化时