面向资源约束的数据流并行自适应缓存管理研究

来源 :中国科学院大学(中国科学院深圳先进技术研究院) | 被引量 : 0次 | 上传用户:Carlower
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据并行系统中应用程序的爆炸式增长,以及对任务处理和数据分析的日益增长的高效需求,使得数据并行系统在处理具有高实时性需求的I/O密集型数据集时承受着较大的内存压力。低效的缓存策略会严重降低资源的利用率影响系统性能。通常情况下,对于需要大量内存计算的数据流任务,如何实现高效的缓存管理是权衡性能和内存开销的主要措施。近些年,设计出恰当的缓存管理策略以平衡工作负载,缓解传输瓶颈,减少内存资源消耗是内存计算中的研究重点之一。在缓存的设计和选择的问题上,研究证实当前主流的基于内存计算并行数据处理系统中包括LRU在内的默认的传统缓存算法并不能有效满足当前环境下应用特征和实时需求,且容易造成低命中率、不必要的I/O开销和资源浪费,主要归因于这些缓存算法多未充分利用数据并行系统中的数据依赖语义信息,而是依赖传统的基于数据项最近访问信息和频率信息等局部信息进行缓存管理。本文旨在设计一种新的缓存算法以达到性能与开销之间进行折衷的目的,该算法称为非关键路径最小引用计数(Non-critical Path Least Reference Count,简称NLC)。其与现有算法的不同之处在于:其一,NLC充分利用了数据并行系统所提供的数据依赖语义信息,将通过数据处理逻辑所提取出的DAG全局信息应用于缓存替换,而不是像大多数现有工作那样仅应用于资源调度。其二:NLC借鉴了Spark中窄、宽依赖的Pipeline作业思想,在保留引用计数(Reference Count)这一局部信息的基础之上可以进一步利用数据依赖语义所提供的动态变化的关键路径全局信息。本文开发了一套应用服务代码和流程代码低耦合的并行数据流调度器,通过对比多种基准测试图实例在受限资源下的执行效果综合评价表明,本文的系统能有效满足并行系统的要求。同时,与当前最先进的基于引用计数信息的缓存算法LRC和Spark等数据并行系统中的默认缓存算法LRU相比,非关键路径最小引用计数策略可以有效地提高命中率和并行执行效率,从而提高资源利用率。最优情况下可将任务响应时间减少19%左右。
其他文献
本研究选取河北地区一所集约化猪场为采样地,于2018年9月份至2019年2月份使用TSI激光粒子计数器、Andersen-6微生物气溶胶采样器等,对该猪场封闭式育肥猪舍内微生物气溶胶进行实时监测及采样分析,通过平皿计数、提取样品DNA、16S r DNA测序等方法,对不同时空中的气溶胶粒子粒径和浓度分布规律及种类进行了详细分析和阐述。试验一:使用TSI激光粒子计数器、Andersen-6微生物气溶
作为经济发展的推动器,创业不但可以保持一个国家和地区的经济具有活力,更能够增加就业岗位并促进社会健康有序的发展。然而,创业也是一项风险性较高的活动,大量的文献研究和实践发现证明,对创业者进行创业指导和帮扶能够有效降低创业失败率。但是在创业指导的过程中,创业导师的指导作用对创业者来说意味着什么,创业指导效果会不会受到创业者与创业导师的人格特质以及指导关系质量的影响?目前主要从创业者与创业导师的大五人
随着多媒体和计算机网络技术的飞速发展,数字图像的采集、存储和共享变得越来越容易。同时,自动数字图像处理与分析技术得到了广泛的发展和应用,使人们能够方便地进行图像识别、分析和理解。然而,这也方便了潜在恶意用户对图像的攻击,特别是对于社交媒体中共享的人脸图像,恶意用户可以利用这些工具从中获取各种个人信息。因此,抗自动识别的人脸图像隐私保护具有十分重要的意义。基于上述问题,本文详细介绍了抗自动识别的人脸
在我国,自然保护区是严格保护的自然地域,经过六十余年的发展,截至2017年,我国已建立各类自然保护区2729处,其中有448个国家级自然保护区,自然保护区面积占国土面积约15.3%,
交通拥堵给城市管理带来诸多问题,解决交通拥堵问题是城市化发展中重要的任务。城市交通自适应控制系统的应用,在一定程度上缓解了交通拥堵。然而,自适应控制系统调控交通信号方案对交通数据完整性要求较高,自身又缺乏灵活性,因此,在交通拥堵情况下无法对交通信号做出合适的调控。现阶段,交通信号的管控仍旧难以脱离人为干预,因此,提高人工信号配时的效率对于治理交通拥堵有着重要的意义。针对人工信号配时疏导交通拥堵对工
为了直观呈现钢凝固过程MnS形貌演变,揭示MnS在枝晶间析出机理,本文将两个不同网格尺寸的元胞自动机(CA)模块耦合成一个多尺度模型,以模拟Fe-C-Mn-S合金凝固过程枝晶间MnS析
近年来,有机发光材料因其在人类生产和生活中的广泛应用和巨大发展潜力而成为科学家们关注的焦点和研究热点。其中,一些有机发光材料对外界的机械刺激十分敏感,在拉伸、研磨或静水压力的作用下其吸收和发光颜色会发生明显的改变,因此在压力传感器、信息存储、发光器件等领域具有广阔的应用前景。然而在较高的压力下,由于分子聚集体间的密堆积效应和芳香环间逐渐增强的π-π相互作用,大部分有机发光材料的发射强度都是逐渐减弱
近代以来的全球经济焕然一新,人类进入信息化社会,智能化的工业机器人开始逐步替代人工生产,已成为现代制造业中必不可少的核心装备,但是高昂的本体成本以及实现功能的效果一直是困扰各大厂商的一个难题。因此本文旨在针对工业机器人存在的成本问题,提出一种经济型六自由度机械臂的方案,在结构本体、轨迹规划和运动控制等方面进行探索。首先,参考国内外机械臂的设计经验,依据本文的经济性的设计原则及要求,进行了机械臂结构
本文研究依托河北省高等学校科学技术研究项目(考虑热-液-力耦合作用下深部干热岩钻井围岩稳定性研究),通过实验室室内实验对花岗岩进行热-液耦合实验处理并进行物理性能实验测试,采用岩石单轴压缩实验对热-液耦合的花岗岩进行力学实验,分析热-液-力耦合的花岗岩的物理和力学性质规律。借助马沸炉和真空饱水装置进行花岗岩的热-液耦合实验,得出实验过程中的岩石物理参数,分析其影响因素对物理参数的影响规律。利用超声
随着互联网信息技术的飞速发展,社交网站和电子商务等平台给人民带来了极大便利,同时网络用户可以随时随地的在这些平台上进行评论文本信息的发布、分享与更新。这些非结构化的文本具有情感极性,获取这些文本中的情感极性可用于产品评论,公众意见分析等任务。依靠人工对这些海量文本信息进行处理是不现实,所以要借助计算机快速、准确的获取文本情感极性。神经网络在近些年获得了突飞猛进的发展,通过非线性的分层的网络结构来逼