存储系统中突发访问行为的分析与预测

被引量 : 0次 | 上传用户:xiaoyuerhaha
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
突发访问是指在一段极短的时间内对服务器出现大量的突击式访问,但服务器的处理能力却满足不了急剧上升的访问量而无法顺利完成用户提交的相关请求。传统的计算机系统往往是基于预期的峰值负载来对资源进行静态配置的,那么突发访问的存在就会带来诸如能耗,资源浪费等问题。由于突发访问行为的随机性,如何有效地预测突发访问行为一直是一个非常具有挑战性的问题。本文提出了一种基于数据挖掘的方法来获取存储系统中的频繁关联I/O,然后通过过滤频繁关联I/O来预测突发访问行为的发生。为了提高频繁关联I/O的挖掘效率,本文在Apriori算法的基础上,结合I/O数据的时间属性,引入关联强化窗口。在产生频繁关联序列的过程中,该窗口能够以默认大小和不定步长,达到减少时间开销,实现时间局部感知以及强化规则关联性的效果。实验表明,新的挖掘算法不但可以获得与原来算法一致的结果,而且降低了原挖掘算法20%到40%的时间开销。此外,本文通过实验分析发现主导突发访问行为的因素并非频繁关联I/O,基于以上发现,本文提出了一种基于关联挖掘的突发预测算法。该算法主要包括以下五个步骤:首先对三个真实的I/O数据集的训练集进行频繁关联I/O的挖掘;其次按照较长时间粒度对数据集进行划分并获得其对应的I/O请求;再次对较短时间粒度内发生的频繁关联I/O进行过滤;然后利用过滤后的块I/O来预测较长时间粒度内的突发访问行为;最后得出这种预测方法的命中率和发生率。本文在确定了突发阈值和观察阈值后,接着利用该算法对三个I/O数据集的测试集进行了验证实验,并与传统的时序预测算法进行了对比。实验表明,在理想的情况下,这种方法可以获得约70%左右的预测命中率,约2倍于时序预测。由此可以得到一个重要的结论:通过较短时间粒度的非频繁关联I/O来预测其对应的较长时间粒度范围内的突发访问情况是可行且具有现实意义的。
其他文献
赤水市坚持问题导向,构建信访矛盾防控化解体系,重点抓好"源头稳控、接访化解、规范处理、案后疏导"四个重点环节,取得了显著成效。一、完善机制,源头稳控化解信访矛盾,需从源
期刊
可靠性、测试性、维修性、安全性(简称“四性”或RTMS)是复杂工业产品安全高效使用的核心质量属性。在航空领域,航空器的高度复杂技术功能系统及其特殊的安全性能要求尤其需
<正>近年来,随着消费者对天然成分的推崇,以中草药护肤为概念的品牌受到消费者的大力追捧。在国内,一些大家耳熟能详的以中医理论为背景的护肤品牌,迅速壮大,成为中国化妆品
空间规划是完善空间治理体系的基础。中央授权宁夏回族自治区开展空间规划试点以来,宁夏积极整合各空间性规划核心内容,不断深化体制机制改革,构建以空间治理和空间结构优化
《中华人民共和国疫苗管理法》(以下简称《疫苗管理法》)自2018 年11 月起草并经国务院第34 次常务会议讨论通过(草案)。在短短的7 个月时间内,历经第十三届全国人大常委会三
<正>2018年1月1日起,《中华人民共和国环境保护税法》(以下简称环保税法)正式施行,这标志着我国环境保护领域"费改税"以立法形式得到确认,意味着近40年的排污收费制度彻底退
目的了解西宁地区手足口病病原学特征,为手足口病防控提供科学依据。方法选择青海省妇女儿童医院、大通红十字医院和互助县人民医院为监测哨点医院,收集2017年就诊的手足口病
<正>截至目前,超过1300万ofo用户排队申请退押金,后续人数可能进一步增加。用户们除了漫长的等待之外,理论上也可以诉诸法律,但目前无论是诉讼还是仲裁,甚至企业进入破产清算
由于数学知识具有抽象性的特点,而小学生恰恰缺失这种能力,所以,教师要发挥联想尽最大可能地变抽象为具体,将数学知识放在一个"境"里,让数学知识以立体的状态出现。顺应学生
前言 子宫内膜癌是女性生殖道最常见的恶性肿瘤,近年来发病率有明显上升趋势。2/3子宫内膜癌患者在初次诊断时处于早期,但估计五年生存率比70年代下降4个百分点。因此,对早期子