大数据处理平台的存储优化技术研究

来源 :云南大学 | 被引量 : 0次 | 上传用户:kjm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
对于大数据处理平台而言,存储系统的设计对提高其性能至关重要。尽管研究人员已经提出了众多优化办法,但现有优化方法均根据系统设置,静态的为计算分配资源、对存储进行管理,忽视了不同工作负载的特征和动态的内存需求,且现有的优化策略未考虑从系统架构当中获取相应的任务调度信息,导致一些优化机会的丧失。针对以上问题,本文提出了一种嵌入数据分析技术的存储优化设计,可全自动的动态优化系统效能。论文的主要工作包括以下三个方面:1.基于工作负载动态的为计算和缓存分配资源。针对系统特征和负载会随时间改变的特性,我们提出对系统进程和设置参数等信息进行侦测,以实时获取系统状态和工作负载。针对相应的系统行为记录,使用数据分析/数据挖掘手段进行分析,结合决策树算法C5.0进行决策.实现对存储系统的动态优化的框架。该框架应用到现有的系统架构上面去,会通过内核获取相应的系统行为进行分析,而不需要更改或重新编译程序源码。2.结合相关性分析和数据挖掘算法,可以对系统行为、系统设置参数以及系统性能指标之间的相关性进行分析,选取关系密切的指标进行追踪和分析.以减少系统效能消耗。3.将提出的SDAF框架应用在缓存系统上,通过监控当前的访存行为,动态的控制相应的替换算法,实现了全自动的自适应系统优化。为了验证提出的想法的可行性,我们选择Hadoop大数据处理平台的缓存管理设计作为实验背景,实验验证了其有效性,说明了我们提出的大数据处理平台的存储优化设计的可行性。
其他文献
随着智能手机和平板电脑等移动终端设备的普及,利用无线连接技术将可穿戴设备与智能移动终端设备互联,是目前可穿戴设备实现人机交互的一种趋势。可穿戴设备与移动端应用的短
我国实行改革开放40周年,未来还将进一步扩大开放,大力发展经济,各地政府根据自身经济、人才发展需求,不断在产业政策上推陈出新,由此衍生了附条件政府奖励的措施。然而,各地
随着科学技术的快速发展,控制领域中复杂控制环境对控制系统的性能要求越来越高,处理中心需要执行更加复杂的处理任务表,处理系统中大量的数据流。由于功耗和散热问题,通过增
随着云计算技术的发展,作为其核心基础设施——数据中心,已成为制约云计算技术快速发展的重要因素,从而引起世界各国研究机构和研究者的广泛关注。传统的数据中心网络结构主
随着互联网信息技术的迅猛发展,门户新闻网站、各类新闻媒体平台和搜索引擎构成的在线多源媒体已然成为了描述各类话题的重要载体。话题在大规模在线多源媒体中呈现的演化过
半导体光催化技术作为一种高效、安全的环境净化技术,已广泛应用于水中污染物的降解、水分解及二氧化碳还原等领域,在治理环境污染和解决能源危机方面有很大的应用前景。石墨
随着云计算时代的到来,云端存储的数据急剧增长,因此云存储系统已经成为云计算中的一个关键要素。云存储中的海量数据,使得云存储系统必须面对一个问题:如何在保证数据的有效
随着互联网通信的发展,移动终端迅速普及,无线网络虚拟化应运而生,为下一代无线网络提供高效定制化的服务。移动终端业务请求的数量与种类不断扩大与丰富,使得无线资源和能量
本研究对184个的农村学生发放问卷、对典型案例进行访谈,通过对有效问卷的定性与定量分析,分析影响农村学生职业发展的相关因素,实证教育对农村学生职业发展的作用和影响,分
图像盲复原是指在点扩散函数未知或者已知部分信息的情况下,从观察到的退化图像中恢复出清晰原始图像,是一个病态逆问题的求解。在计算机视觉领域,去除图像模糊是一个具有挑