基于价值评估策略的教育资源分布式存储管理研究

来源 :华中师范大学 | 被引量 : 0次 | 上传用户:qianxiaoping
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
教育信息化2.0时代下,数字教育资源出现了爆炸式的增长,传统的单机文件系统已经无法容纳这些海量的教育资源,HDFS(Hadoop Distributed File System)作为分布式存储系统的佼佼者,凭借其可以安装在低成本的机器上,拥有高容错、高可靠性以及流式访问等特点,很适合用来存储海量教育资源。尽管HDFS作为海量教育资源的存储系统很有优势,但原生的HDFS也存在可以改进的地方:一方面,随着存储的教育资源增多,HDFS采用的默认放置算法导致数据节点负载不均匀的现象愈加明显,这会严重影响文件系统性能;另一方面,HDFS为了保证数据可靠性而不加区分的对所有教育资源采用多副本冗余策略,这会给文件系统带来极大的存储代价。为了改进HDFS文件系统存在的不足,本文通过充分的调研发现目前的研究多是从文件的热度以及集群节点的异构性入手,其中文件热度又是指导算法改进的主要参考指标。对于教育资源存储来说,文件热度就是教育资源的受欢迎程度,而教育资源相对于其他文件资源来说,是否受学习者欢迎与其资源的价值密切相关。因此,本文将结合教育资源价值对HDFS的放置算法和数据冗余策略的改进展开研究。首先,为了实现对教育资源受欢迎程度评估,本文建立了教育资源价值评价指标体系,在选择评价指标时参考了受欢迎教育资源的普遍特点以及前人构建的各类具体教育资源评价体系;建立教育资源评价体系是为了指导后续放置算法和资源冗余存储策略的改进,故通过构建教育资源的价值评级模型来将教育资源划分等级。然后,利用划分好的教育资源等级,本文设计了一个基于教育资源评级的存储放置算法,该算法额外记录了每个数据节点中各评级教育资源的数据量,当存入资源时,将综合各数据节点的存储数据量和该存入资源所对应评级的存储数据量后进行排序,以选取一个最合适的存储节点。最后,鉴于传统多副本存储策略对会消耗大量的资源空间,本文提出了一种基于教育资源评级的数据冗余存储策略,根据不同评级的教育资源受欢迎程度不同,对于评级高的教育资源采用多副本存储方案,保证资源可靠性的同时提高系统负载能力,对于评级较低的教育资源采取纠删码技术进行冗余存储,并提出一种动态转换算法,方便两种冗余存储方案的转换。本文为了验证算法的有效性,在提出相关改进算法或策略的对应章节都进行了仿真模拟实验,通过与HDFS默认的算法或策略的实验结果展开对比分析,得出改进的放置算法实现了各节点存储负载均衡、提升了访问负载能力,改进的存储策略减少了空间消耗,提高了存储利用率。
其他文献
在我国,为推进实施“安居工程”而建设的保障性住房——安居房,对解决中低收入居民的住房问题起到了很大的作用。坐落在偏远的农村地区的安居房在建设过程中往往存在“乱建、
医疗建筑作为一种特殊建筑,是社会保障的重要组成部分,是医疗卫生服务的主要提供者,关系到广大人民群众的身体健康,其建设质量也是社会各界关注的重点。随着医疗建筑数量的不断增加,其工程质量等方面面临着诸多问题,工程建设事中事后监管体系不完善问题逐渐显现,加强对医疗建筑质量监督是当今社会亟待解决的问题。本文分析了医疗建筑质量监督的监督理论,阐述对医疗建筑质量监督的原则,方法,并提出针对医疗建筑的质量监督措
目前,随着越来越多的传感设备接入到智能家居中,使智能家居产生的大量隐私数据被非法用户获取,因此本文的工作为设计适用于智能家居通信场景下的访问控制机制。完整的访问控
斑马鱼幼鱼作为一种典型的有脊椎模式生物,近年来在生命科学相关研究中得到了越来越广泛的关注。斑马鱼因为具有与人类基因相似度高、生长周期短、繁殖能力强、身体透明等优
调炮速度及其稳定性将影响火炮是否能够准确、快速、稳定的对目标进行识别与定位,是评价火炮控制系统性能参数的一项重要的静态测试指标。针对传统调炮速度测量方法操作复杂
随着人们环保意识的提高和大社会环境对节能减排的日益重视,新能源汽车销量逐年攀升。通过对市场进行调研可知,目前大部分电动汽车品牌的动力电池都为锂电池,而其中磷酸铁锂电池因其优良特性成为动力电池的首选。因此本文选取常用的磷酸铁锂单体电池为试验对象,通过大量的充放电实验研究其充放电特点,同时关注极化电压和温升对充电效率的影响,由马斯三定律的最大充电电流边界曲线的思路,提出一种优化电池充电时极化电压的快充
经济与科技的迅猛进步,为生态环境带来冲击,环境议题成为社会焦点,公众渐渐认清环境问题不仅影响社会生活秩序、造成经济损失,最终还将会威胁到人们的生命安全。面对大自然日
最小点覆盖问题(Minimum Vertex Cover problem,MVCP)是给定一个无向图G=(V,E),求顶点集V的最小子集S,使G中每条边在S中至少有一个端点。该问题是经典的NP完全问题,目前没有
现阶段我国的混凝土桥梁施工由于造价原因,大多采用现场浇筑混凝土的方法,由于要保证现场浇筑混凝土的工作性,以及新拌混凝土在运输、泵送过程中保持良好状态,这促使现代混凝
背景与目的:低蛋白血症对危重病人有生命危险。在这项研究中,我们建立了一个基于深度神经网络的患者特定监测和预测模型,用于实时预测危重患者的白蛋白浓度和一组选定的生化