基于时间序列的存储负载预警研究

来源 :智能计算机与应用 | 被引量 : 0次 | 上传用户:iorikof1107
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  文章编号: 2095-2163(2018)03-0188-04中图分类号: 文献标志码: A
  摘要: 关键词: (1 Department of Computer Engineering, Shanxi Architectural College, Taiyuan 030006, China;
  2 Department of Information Technology, Shanxi Professional College of Finance, Taiyuan 030008, China)
  Abstract: High load rate of data center storage can cause performance reduction of application system and even lead to paralysis. So predicting storage load situation of the future could effectively avoid the system failure of application system due to exhaustion of storage capacity. In this paper, time series analysis is used to analyze the storage performance history data, and the ARIMA model of storage capacity prediction constructed based on python is used to realize the automatic warning of storage load.
  Key words:
  作者簡介:
  收稿日期: 引言
  应用系统存储负荷预测主要用于预测未来一周内的存储负荷,让系统管理员及时了解当前和未来应用系统的存储负载情况,以便提前预防,确保系统安全稳定运行。准确的存储负荷预测可以利于全局统筹分配应用系统的存储空间,保证数据中心的长期持续与经济运行,合理安排应用系统存储空间扩容计划,并科学控制数据中心存储成本,是数据中心优化和自动控制的前提,能有效降低数据中心PUE指数,对绿色数据中心建设具有重要的意义。
  目前应用系统的存储负荷预警多数采用设定存储空间已使用比率阈值的方式,当存储空间占用率超出设定的阈值大小时,向系统管理员发送警报,但不能进行存储负载情况的短期预测。ARIMA模型考虑了序列的依存性和随机波动的干扰性,数据类型不受限制,具有短期预测效果出众的特点。同时,存储空间随时间变化存在很强的关联性,历史数据对未来的发展有一定的影响,故可使用ARIMA模型对存储系统已使用空间进行短期预测,为数据中心存储系统良性可靠运行提供科学依据。
  1ARIMA模型
  ARIMA(p,d,q)模型的全称是差分自回归移动平均模型,实质是差分运算与ARMA模型的组合。其中,p表示自回归项;d表示该序列转化成平稳序列过程中需调用差分运算的次数;q表示移动平均项。
  ARIMA模型是目前最常用的拟合非平稳序列模型,又可进一步细分为自回归、移动回归和自回归移动平均模型。对其研究得到阐释解析如下。
  1.1AR模型
  具有如下结构的模型为p阶自回归模型,记为AR(p)。数学公式可见如下:
  xt = 0 1 xt-1 2 xt-2 … p xt-p εt(1)
  其中,在t时刻的随机变量Xt的取值xt是前p期xt-1,xt-2…,xt-p的多元线性回归,误差项为当期的随机干扰ε,为零均值白噪声序列。
  1.2MA模型
  具有如下结构的模型为q阶自回归模型,记为MA(q)。数学公式可见如下:
  xt =μ εt - θ1εt-1- θ2εt-2 - … -θqεt-q (2)
  其中,在t时刻的随机变量Xt的取值xt是前q期的随机扰动εt-1,εt-2,…,εt-q的多元线性函数,误差项为当期的随机干扰ε,为零均值白噪声序列。
  1.3ARMA模型
  具有如下结构的模型为自回归移动平均模型,记为ARMA(p,q)。数学公式可见如下:
  xt =[ZK(] 0 1 xt-1 2 xt-2 … p xt-p εt -θ1εt-1- θ2εt-2 - …… -θqεt-q[ZK)][JY](3)综上可知,这是ARIMA模型的一般形式。xt是受过去p期的序列值和过去q期的误差项的共同影响。当q=0时,是AR(p)模型;当p=0时,是MA(q)模型。[BT5]1.4ARIMA模型建模过程研究得到ARIMA模型的建模步骤流程如图1所示。这里,将给出各步骤内容详见如下。[PS李刚1.EPS;S*3;X*3,BP#][HT6H][ST6HZ][WT6HZ][JZ]图1时间序列ARIMA模型建模步骤[JZ]Fig. 1Time series ARIMA model modeling steps[HT5SS][ST5BZ][WT5BZ](1)[JP2]原始序列的平稳化处理。时间序列ARMA[JP]模型必须在平稳时间序列的基础上建立模型,但大多数序列都是非平稳的,许多非平稳序列差分后即成为平稳序列。平稳性检验的方法有时序图检验、自相关检验和单位根检验。(2)白噪声检验。判断时间序列是否为纯随机序列。如果一个序列是纯随机序列,在其序列值之间没有任何关系,可以停止对该序列的分析。常用的检验统计量有Q统计量、LB统计量。(3)模型识别方法一:对非平稳白噪声序列做自相关图(ACF)和偏自相关图(PACF),根据图中数值的变化趋势,确定模型中的p,q这2个参数。方法二:采用BIC准则对模型进行定阶,从而选择最优模型。(4)模型检验。使用acorr_ljungbox()函数计算模型残差白噪声。(5)预测走势。[BT4]2应用ARIMA模型的存储负载预测[BT5]2.1数据来源与处理研究节选了某高校数据中心2017年5月1日至6月16日从存储系统中每天定时抽取的存储内容数据,在原始数据的基础上剔除重复数据,从中提取sys_name、used_space、collect_time这3列数据,其中存储已使用空间单位为GB。预处理后的存储负荷部分数据如图2所示。   利用python中的Matplotlib库对5月1日至6月16日的存储负荷做时序图,设计绘制效果如图3所示。通过观察图形特征可知,存储使用情况不具备周期性,表现出缓慢增长趋势,序列非平稳。[BT5]2.2ARIMA建模2.2.1序列平稳性和白噪声检验构建ARIMA模型前,需要对存储负荷序列进行平稳性检验。本次研究采用单位根(ADF)的方法对数据进行平稳性检验,经检验p=0.721 2,单位根检验统计量对应的p值显著大于0.05,结合存储负荷时序图(见图3),說明该时间序列不平稳。对原始序列展开一阶差分处理处理,再将一阶差分序列提送ADF检验,p=1.336 8e-08,p值小于0.05,说明经过一阶差分后的序列平稳。利用python StatsModels库中的accrr_ljungbox( )函数进行序列白噪声检测,lb=6.97,p=0.008 28,输出的p值远小于0.05,因此一阶差分后的序列就是平稳非白噪声序列。2.2.2模型识别一阶差分后自相关图显示出一阶截尾,偏自相关图显示出拖尾性,运行效果则如图4所示。同时,采用极大似然比方法进行模型的参数估计,利用python StatsModels库中的ARIMA( )函数基于BIC最小化原则进行自动筛选,确定p、q参数,研究结果显示ARIMA(0,1,1)模型的BIC最小,其值为408.366 015。最终确定ARIMA(0,1,1)为最优模型。
  参考文献[1] [ZK(#〗[HJ*2] ROUT M, MAJHI B, MAJHI R, et al. Forecasting of currency exchange rates using an adaptive ARMA model with differential evolution based training[J]. Journal of King Saud University-Computer and Information Sciences, 2014, 26 (1): 7-18.
  [2] 何书元. 应用时间序列分析[M]. 北京:北京大学出版社,2007.
  [3] 王燕. 应用时间序列分析[M]. 4版. 北京:中国人民大学出版社,2015.
  [4] 王振龙. 时间序列分析[M]. 北京:中国统计出版社,2002.
  [5] 张良均,王路,谭立云,等. Python数据分析与挖掘实战[M]. 北京:机械工业出版社,2015.
  [6] 崔和瑞,彭旭. 基于ARIMAX模型的夏季短期电力负荷预测[J]. 电力系统保护与控制,2015,43(4):108-114.
  [7] 麦鸿坤,肖坚红,吴熙辰,等. 基于R语言的负荷预测ARIMA模型并行化研究[J]. 电网技术,2015,39(11):3216-3220.[ZK)][FL)]
其他文献
告诉你一件有趣的事。武汉市有几千辆公汽,前后门都用中英文写上了“上车”,“下车”和“Up”,“Down”。这本来是个好主意。可是你想过吗?这里的“Up
Step 1 (for Section A)     Ⅰ. 选择填空。  ()1. —Do you want to ______ a movie star?   —Yes, I do.   A. beB. isC. areD. /  ()2. What kind of ______ do you like?  A. movieB. a movie   C. moviesD. the movie  
【新目标英语七年级(下)Unit 9 Step by Step随堂通】  Step 1(for Section A)   Ⅰ. 1. What did; did her homework  2. Did; clean; did; When did; clean  3. How was; played computer games  Ⅱ. 1. speak2. playing3. reading4.
名师档案:  菲利普·塔斯卡(Phillip Tyska)来自美国奥古斯塔那大学(Augustana College),华中师范大学外国语学院外籍教师。从小热爱中国文化的他,将自己比作一座贯通中西文化的“桥梁”,积极地为中国学生讲授英语学习方法并广泛普及英美文化知识。近日,《中学生英语》特约记者赵凡走近菲利普,和他一起谈论圣诞节的趣闻轶事,在品味中西文化的同时,菲利普向本刊读者朋友们传授英语学习的
研究背景  目前,国内外对水面悬浮垃圾的清理收集主要通过人力捕捞方式和机动船收集方式,对悬崖岸边附近水域、小水面水域、浅水面水域和机动船无法到达的重要水域(如取水口水域、趸船回水水域、桥墩回水水域等),以及无法依靠人力捕捞方式实现清理收集的特殊水域的水面悬浮垃圾的清理收集,还未找到根本上的解决办法。针对这一情况,我设计了水面悬浮垃圾收集装置,实现水面悬浮垃圾顺着有序水流自动进入收集装置,能很方便地
[内容摘要] “工艺作家”是现代日本对工艺造物活动中的工艺创作者的一种称谓。本文通过对工艺作家性质、地位的探讨,通过对“民艺作家”和“前卫作家”这两个在工艺创作理念上完全不同的概念以及现代日本工艺作家群体进行分析归纳,来探析日本工艺作家、工艺群体的创作思想和现代工艺发展的状况,以期对中国现代工艺美术的生存和发展有所启示。  [关键词] 工艺作家 工艺团体 活态 多元  一、何为“工艺作家”  在日
[内容摘要] 该论文重点围绕装饰造型的构成元素和创作训练的各个环节,有针对性地阐述了创作设计从感性回归理性的过程,结合作品进行剖析,使学生详尽地了解形式语言的构成以及装饰的特性和形式美感,并将其融入于日后的实际训练之中。  [关键词] 形象?元素?美感?形式  作为一个“自然人”,其生活中的各个方面为艺术创作提供了多元而丰富的素材,可谓创作离不开生活。谈到“自然”一词,其实是一个极为广泛的涵义,其
据英国《每日邮报》2014年2月20日报道,来自美国弗洛里达州的艺术家珍妮特·艾克曼正在为下个月在温哥华举行的TED大会打造一个700英尺长的大型悬空雕塑,该雕塑将悬挂在温哥华费尔蒙特海滨酒店和温哥华会展中心之间。  该雕塑用极其柔软的材料构成,结合科技和艺术,将呈现出星云的效果。该部作品由珍妮特和美国电脑软件公司欧特克共同完成。据珍妮特透露,TED大会结束之后,“星云”将开始环球旅行,将TED的
齐白石是一位集诗书画印于一体的艺术大师。仅在艺术本体领域,抛开他的诗文,即使在美术部分,他的艺术园地也仍然称得上是蔚为大观,所作囊括了书法、人物、山水、花鸟以及篆刻等艺术诸门类。在大师诞辰150周年之际,本文拟以齐白石艺术生涯中的创作重心迁移转换过程为基本顺序,把他艺术中的美术范畴分成五个部分,从创作历程、艺术风格、价值与影响等不同的角度,百年回眸、重读大师。  一、书法:同源异出  齐白石的书法
Step 1 (for Section A)     Ⅰ. 根据句意及首字母提示,完成单词。  1. Dave is my good f______.  2. Mr Green has a lovely (可爱的) s______.   He’s six years old.  3. There are f______ members(成员) in my family. They are my f