论文部分内容阅读
预测是科学研究的中心问题之一,是科学决策和规划的重要前提。作为现代岩土工程的难点和迫切需要解决的问题,岩土体变形行为预测,正逐渐成为国内外学术界、工程界关注的热点。本文结合支持向量机这种优秀的机器学习算法,围绕岩土体非线性变形行为预测问题展开工作,研究的主要内容包括四个方面:变形时序的数据表示、支持向量机算法的核函数构造、超参数选择以及变形时序数据的外推预测。主要的工作有:(1)针对岩土体变形时序数据非常有限而降低学习建模效率的情况,首次提出了变形时序数据再生的概念,方法采用分段插值方法和Bootstrap重采样技术对样本容量进行补充和扩展,以丰富岩土体系统变形演化的细节。同时,提出以低维坐标空间变换和高维相空间重构的数据表示方法,对变形数据序列的表示形式进行重构,达到改写数据的规律性进而探讨岩土体系统内在的复杂本质特征的目的。(2)着重分析了变形时序曲线特征以及不同类型Mercer核的性质,提出了岩土体变形时序支持向量机预测建模中核函数的选择原则;同时,从理论上,基于核函数上的封闭运算,构造出了适合于变形序列预测领域支持向量机建模的复杂核函数。复杂核函数扩大了函数的容量,使得学习算法的应用柔性增大,有利于提高建模的回归精度又不致于降低模型的泛化性能。从核的空间映射,利用变形时序某一数据点的变化趋势更多的是由邻近的数据点所决定这一先验知识,对核矩阵或核函数进行调整以提高核函数匹配手头问题的性能。鉴于优秀核函数具有相似形式的思路,深入分析了一个好的核函数应该具、有的形式,并在此基础之上引入了全信息下的平移不变核和具有统一形式的核函数。前者在高维映射的空间中既着重于近邻点的数据信息,又保留了全部数据点信息。从而扩充了核矩阵关于特征空间或模型的选择的信息,以及训练数据本身的信息量。后者为一个点积核与距离核的有限形式统一的核函数,可以简化对核函数选择的复杂过程。(3)提出了基于正交设计试验的超参数层次选择方法和Boosting集成超参优化方法。正交设计方法在分析确定了支持向量机各个超参数的取值范围,并为每个参数选定了试验水平。通过考虑参数间的正交性和交互性,层次的选取最优超参数组合下的支持向量机模型。较其他超参选择法,正交设计超参数选择方法更快捷有效,适合于工程中支持向量机的实际应用。Boosting集成的参数优化,是通过在原始数据集加权采样的基础上,进行多次迭代子支持向量回归的机器学习,不断调整样本权值再采样,优化机器学习模型,然后对迭代所得的每级子支持向量回归结果按某种组合方法进行集成,最终获取优参下的支持向量机学习模型。(4)提出了变形趋势预判下的支持向量机预测方法。对时序的趋势预判,以两种思路进行了实现:专家辨识,基于岩土体变形和时序曲线的特点,在定义变形时序外延模式并建立综合专家系统的基础上,以定性和定量结合的方式达到辨识时序的外延模式;范例推理,对变形时序组成的范例库进行欧氏距离的范例属性以及变形时序原子矩阵的相似度计算,检索与目标范例(待预测问题)最为相似的范例,并参考相似范例,对目标范例时序的未来时刻的变化趋势进行预判。两种思路实现下的方法以及开发出的程序系统,能够在变形时序数据有限或不具备关键信息拐点的情况下,获得优秀的支持向量机学习模型。