论文部分内容阅读
面向国家重大战略需求,近年来我国在航空航天、交通运输、能源动力等领域对大规模复杂软件系统的应用需求逐渐凸显。基于服务组合的"系统的系统"(System of Systems,SoS),采用系统即服务的思想,通过服务组合技术,集成已有的组件系统,从而形成一个新的系统,满足更为复杂的用户需求。借助服务化,服务组合技术已成为构建SoS的一种重要的、可.行的方法。由此看来,服务化的思想已成为构建大规模复杂软件系统的一种重要思想。所构建的系统运行在动态、多变的环境下,单个系统的变化甚至可能会产生级联效应,导致整个系统不能工作。因此,软件的运行质量保障问题对基于服务组合的SoS而言,显得尤为重要。面向SoS组件系统的在线可靠性时间序列预测技术,通过预测组件系统不远的未来的系统可靠性时间序列,从而为SoS中的组件系统选择提供前摄式的指导,已成为基于服务组合的SoS运行质量保障研究和应用中一个新的需要迫切解决的挑战性问题。针对这一问题的解决,目前主要受到以下几个方面的挑战:(1)组件系统动态、多变的运行环境;(2)SoS运行质量保障应用对需要预测的未来的可靠性时间序列的精度要求;(3)有限的可以用于开展可靠性预测的客户端观测参数。更进一步地,当多变的、迅速累积的组件系统观测参数积累到一定规模后,面向组件系统的在线可靠性时间序列预测问题还将面临以下大数据计算的挑战,主要包括:(1)数据体量巨大;(2)组件系统运行参数时间序列的不确定性的时序演化;(3)构建预测模型时问题求解的高度复杂性。传统的有关SoS以及服务系统可靠性预测、面向传统计算机系统错误预测的在线错误预测等方面的研究方法,都很难系统地解决上述挑战。本文通过调查大量的机器学习方法,探寻不确定性演化的组件系统系统参数时间序列的时序演化规律的建模与推理方法。提出基于概率图模型、多步轨迹动态贝叶斯网络模型,以及卷积神经网络模型的多种不同的组件系统在线可靠性时间序列预测方法,并针对不同的应用场景给出了如何开展相应预测方法的应用的软件框架。具体而言,本文的主要工作包括:(1)对基于服务组合的SoS的组件系统的可靠性进行了系统的研究,给出了其严格的定义。在这一定义中,提出了一种新的性能敏感的需求失效率评价指标(performance-aware Probability of Failure on-Demand,paPoFod),并将这一指标应用于指数可靠性函数,以计算组件系统的可靠性。(2)提出通过响应时间和吞吐量这两组应用层系统参数时间序列来描述组件系统在特定时间段的运行状态,在此基础上,针对不确定性演化的组件系统的运行状态,提出1-阶马尔科夫独立假设和条件独立假设,并以此来描述组件系统运行状态的时序演化特征。(3)将时间序列motifs引入概率图模型,从而提出一种基于motifs的动态贝叶斯网络模型(motifs-based Dynamic Bayeaian Networks,m_DBNs),以及基于 m_DBNs 模型的组件系统在线可靠性时间序列预测方法。(4)通过考虑多步邻近的历史预测的误差来进一步校准未来预测的精度,从而提出一种多步轨迹动态贝叶斯网络模型(multi-steps trajectories Dynamic Bayesian Networks,multi_DBNs)。(5)调查了深度学习方法在解决大服务系统应用环境下,组件系统在线可靠性时间序列预测的大数据计算挑战方面的有效性。提出一种基于卷积神经网络模型·(Convolutional Neural Networks,CNN)的大服务组件系统的在线可靠性时间序列预测方法。(6)分别对基于m_DBNs、multi_DBNs以及CNN模型的组件系统在线可靠性时间序列预测方法开展大量的实验分析,实验结果表明,所提出的方法较其他预测模型具有更高的预测准确率,更好的鲁棒性,以及更快的收敛速度。(7)给出了针对不同预测模型的两个典型的应用场景,并分别设计了基于组件系统在线可靠性时间序列预测结果的优化服务选择和主动式容错的软件应用解决方案。本文的研究解决了不确定环境下的组件系统在线可靠性时间序列预测问题。论文的工作对基于服务组合的SoS软件运行质量保障问题提供了一种有效的、系统的解决方案,为我国开展大规模复杂软件系统的应用提供支撑。