论文部分内容阅读
数据分析云服务(Data Analysis Services on Cloud,简写为DASC)利用云计算满足其对计算资源的大量需求,成为一种新的具有高性价比的数据分析实现方式,近年来在科学计算、金融等领域受到广泛关注。由于数据分析云服务的计算规模普遍偏大,服务质量较一般云服务偏低,因而对其服务质量进行预测具有极强的现实意义及实际需求。数据分析云服务的工作负载包含服务请求率以及服务请求中业务参数取值等信息,它们在数据分析云服务的持续运行中会发生动态变化,对数据分析云服务的服务质量产生重大影响。然而,面对数据分析云服务的服务质量预测这一新问题,目前已有的云软件服务质量预测研究没有考虑业务参数取值的动态变化给软件服务质量带来的影响,因此其服务质量预测准确度难以令人满意。针对这一问题,设计了一种基于负载预测的两阶段DASC服务质量预测方法(Two Phase QoS Prediction Approach,TPQPA),第一阶段预测 DASC 负载的服务请求率及服务请求中业务参数的取值,第二阶段以负载的预测值作为输入对DASC的服务质量进行预测,以达到更高的预测准确度。首先提出一种DASC的负载预测方法,对指定日期及时刻下DASC负载的服务请求率以及请求中的业务参数取值进行预测,作为TPQPA方法的第一阶段。在该方法中,基于改进的K-Means聚类方法对每一天的负载信息进行统计和学习,得出一天内不同的时间区块(如高峰期、平峰期、低谷期等)。每天的所有时间区块构成一个日负载,对所有日负载进行聚类,进一步得出不同的日负载模式。针对指定日期及时刻,使用SVM模型预测该日负载所属的日负载模式。在该日负载模式下基于K-Means方法实现DASC负载的服务请求率预测,并通过业务参数取值的拟合分布函数实现负载的业务参数预测。然后提出了一种基于负载的DASC服务质量预测方法,作为TPQPA方法的第二阶段。在该方法中,基于SVM模型根据DASC的负载预测值以及计算环境的计算能力预测出DASC QoS关键组件的服务质量;基于测试方法获取DASC QoS非关键组件的服务质量;根据数据分析云服务的部署结构,结合各组件的服务质量预测值,实现数据分析云服务整体的服务质量预测。最后通过一个金融领域的交易数据分析云服务案例研究,阐述了 TPQPA方法的实施。此外,还进行了两组对比实验,将TPQPA的预测结果与其它服务质量预测方法的预测结果进行对比,结果显示本文提出的TPQPA方法对数据分析云服务QoS预测的准确性有较大提高。