论文部分内容阅读
本文针对最小二乘支持向量回归机(Least squares support vector regression machine, LSSVRM)算法及其在大气污染物浓度预测中的应用问题,研究了LSSVRM的参数选择和训练算法,主要内容包括: 首先,正则化参数和核参数影响LSSVRM模型的复杂度和泛化性能,参数选择是建模的前提。结合差分进化具有较强的全局优化能力和拟牛顿法具有局部开发能力并且收敛速度快等优点,提出差分进化和拟牛顿法相结合的参数选择算法。将对参数可微的快速l折交叉验证均方误差作为适应度函数,在每一代种群进化中先采用差分进化算法进行全局搜索,从中选出性能较好的精英个体,再使用拟牛顿法进行局部开发,提高精英个体的性能。在四个标准数据集、二元函数逼近问题和太阳黑子数预测问题上验证了所提算法的有效性。 其次,针对自适应剪枝LSSVRM算法存在泛化性能不理想和训练速度慢的不足,提出改进的自适应剪枝LSSVRM算法。为增强泛化性能,采用最小绝对留一误差的剪枝策略,并提出停止条件中包含所有训练样本约束的新目标函数。为加快训练速度,使用被剪枝样本和快速留一误差加快验证减量学习后得到的临时模型。在六个标准数据集上验证了所提算法的有效性。 然后,针对LSSVRM的解缺乏稀疏性,采用向量相关分析在高维特征空间约简支持向量。为使约简模型最佳逼近原模型,提出原模型与约简模型预测训练样本的误差平方和作为新性能评价准则。定义了离散加法、减法和乘法算子,并将新性能评价准则作为适应度函数,采用整数编码差分进化算法进行全局优化得到最优约简模型。在四个标准数据集上验证了所提算法的有效性。 再次,针对LSSVRM算法鲁棒性差,采用基于留一误差的鲁棒“3σ”准则检测并删除异常样本以增强鲁棒性。在保证鲁棒性的基础上,采用基于最小绝对留一误差的剪枝策略删除不重要样本以提高稀疏性。为降低计算量,采用减量学习更新模型和快速留一误差。在一元函数数据集和五个标准数据集上验证了所提算法的有效性。 最后,建立了哈尔滨市冬季大气二氧化氮浓度LSSVRM模型。针对实测气象数据和二氧化氮浓度数据存在缺失现象,采用LSSVRM建模预测补偿缺失数据。采用基于差分进化和拟牛顿法的参数选择算法确定 LSSVRM模型最优参数,建立了大气二氧化氮浓度改进的自适应剪枝LSSVRM模型和约简LSSVRM模型。实验结果表明约简LSSVRM模型在建模精度和泛化性能方面优于神经网络模型、支持向量回归机模型和改进的自适应剪枝LSSVRM模型。