论文部分内容阅读
摘 要:矿井气体的定量分析对于是实现矿井安全实时检测反馈的基础。采用傅里叶变换红外光谱法获取甲烷、乙烷等5种煤矿井气体的光谱数据,并基于支持向量回归机(SVR)建立非线性回归模型,对未知样本进行定量分析。使用SVR对气体红外光谱进行定量分析时,惩罚系数和核参数的选择直接决定了算法的精度和耗时。该文分别采用网格搜索法、遗传算和及粒子群算法对SVR模型的重要参数对进行优化,并比较上述3种算法优化后的模型性能。结果表明:3种算法的回归精度基本都能达到10-4,但预测精度差异较大。其中,粒子群算法计算时间较短,最小均方差为2×10-4,能达到较高的精度,在实践中值得推广。
关键词:矿井气体 红外吸收光谱 支持向量机回归 参数优化 粒子群算法
中图分类号:TP181 文献标识码:A 文章编号:1674-098X(2015)12(b)-0095-02
矿井气体组分主要包括一氧化碳、二氧化碳、甲烷、乙烷、丙烷等[1-2]。根据氧化气体产物的构成、浓度及其变化速率等特性,可对煤炭自然发火做出准确的预测预报[3-4],用来指导煤矿的防灭火安全生产工作。红外光谱法作为检测有害气体的主要方法之一,具有较高的信噪比和较快的分析速度,在矿井气体分析领域有广泛的应用[5]。
由于气体特征谱带较宽,而且烷烃类气体的特征峰严重重叠,以致单独预测每种气体的属性和浓度较为困难。目前主要使用的方法有主成分回归、偏最小二乘法等风险经验最小化方法,和以支持向量回归机(SVR)为代表的非线性建模方法,其中SVR具有较高的回归精度和预测性能。
1 支持向量机回归算法概述
SVM是基于结构风险最小化原理的新型学习机。SVR是建立在SVM思想上,可用于解决回归问题的新型算法。SVR不但具有SVM的优点,而且其通过将数据映射到高维空间进行线性拟合,较传统非线性拟合方法具有更低的过拟合风险,但是SVR的理论优势取决于其关键参数惩罚系数C和核参数g是否合适。
C、和g这3种参数优选法的实现,都基于将SVR的模型结构及其预测算法嵌入对应的算法步骤中。网格搜索法(GRID)、遗传算法(GA)以及粒子群算法(PSO)作为成熟的优化算法,在理论上较高的精度和可靠性,且耗时更短。文章比较这3种优化SVR,并选取均方差(MSE)作为评判精度的指标:
(1)
式中,为新样本的估计值;n为样本数。
2 基于SVR的矿井气体预测模型
矿井气体组分浓度的定量分析是指在待测气体浓度或其他性质与测试仪器的测量结果之间构建定量关联关系。对红外光谱分析而言,则是用统计的方法在矿井气体组分的种类和浓度值与红外光谱数据之间建立一个关联模型(校正模型),应用建立的校正模型即可对待测气体组分浓度进行预测。定量模型建立之后,必须对其进行验证,以确保模型对光谱信息和样品浓度信息之间的回归关系表征正确,模型的预测能力满足定量分析的精度要求。
文章采用选用RBF核函数,分别使用GRID、GA、PSO算法进行参数优化,对甲烷、乙烷、丙烷等5种典型矿井气体的组分浓度进行回归预测。
3 不同算法下矿井气体定量分析结果对比
文章使用美国赛默飞世尔科技公司的Nicolet-Nexus870型傅里叶变换红外光谱仪,共测得186组模拟矿井气体的光谱数据,将其中136组作为训练样本,剩余50组样本数据作为测试集。用优化所得的C和g对校正集各维进行训练建立SVR校正模型,利用原始数据对模型进行回归验证。
通过计算得到,采用不同优化算法时的MSE值都小于0.06,且R值接近1,说明各模型的学习能力较好。为进一步评价各参数优选法对矿井气体组分浓度的预测性能优劣,对不同参数设置下模型的预测结果进行了对比(如表1所示),其中T为各SVR完成训练校正集以并获得预测结果参数所需的总时长。
由表1可以看出,3种SVR计算时长都在80 s以下,但PSO和GA的计算时长普遍短于GRID。甲烷、乙烷以及二氧化碳在混合气体中的浓度均能被这3种SVR实现较为准确的预测,其中相关系数R均大于0.9,且最小MSE都在0.02以下,而乙烷、丙烷的浓度预测误差则相对较大。由于烷类气体的红外吸收光谱在波段以及波峰吸收值上存在较大的重叠,丙烷和丁烷尤为严重,其预测结果如图1所示。
由图1可以看出,对于丙烷和丁烷,基于PSO优化模型明显优于其他两种算法,且其对丙烷和丁烷预测后所得均方差均低于其他两种算法,相关系数也高于其他算法优化的SVR,从而证明利用PSO优化SVR模型参数对(C,g)的适用性。
4 结语
矿井气体的红外吸收光谱能够反映其组分种类及其浓度的信息,但是烷烃类气体存在较为严重的波峰重叠,所以需要通过非线性建模的方法对其进行定量分析。SVR在对矿井气体红外光谱进行定量分析时,具有较高的精度;但是实现此优势的前提则是选取到最佳参数对(C,g)。经过试验分析,对现阶段较为常用的参数选择法如GRID、GA以及PSO的性能进行了对比,发现使用PSO优化的模型在对矿井气体的定量回归预测上的综合性能更好。
参考文献
[1]张国枢.通风安全学[M].徐州:中国矿业大学出版社,2007.
[2]王显政.煤矿安全新技术[M].北京:煤炭科学出版社,2002.
[3]梁运涛.煤炭自然发火预测预报的气体指标法[J].煤炭科学技术,2008(6):5-8.
[4]罗海珠,梁运涛.煤自然发火预测预报技术的现状与展望[J].中国安全科学学报,2003(3):79-81.
[5]Naoual Makhoukhia,Eve Pere.Determination of the composition of a mixture of gases by infrared analysis and chemometric methods[J]. Journal of Molecular Structure,2005(744-747): 855-859.
关键词:矿井气体 红外吸收光谱 支持向量机回归 参数优化 粒子群算法
中图分类号:TP181 文献标识码:A 文章编号:1674-098X(2015)12(b)-0095-02
矿井气体组分主要包括一氧化碳、二氧化碳、甲烷、乙烷、丙烷等[1-2]。根据氧化气体产物的构成、浓度及其变化速率等特性,可对煤炭自然发火做出准确的预测预报[3-4],用来指导煤矿的防灭火安全生产工作。红外光谱法作为检测有害气体的主要方法之一,具有较高的信噪比和较快的分析速度,在矿井气体分析领域有广泛的应用[5]。
由于气体特征谱带较宽,而且烷烃类气体的特征峰严重重叠,以致单独预测每种气体的属性和浓度较为困难。目前主要使用的方法有主成分回归、偏最小二乘法等风险经验最小化方法,和以支持向量回归机(SVR)为代表的非线性建模方法,其中SVR具有较高的回归精度和预测性能。
1 支持向量机回归算法概述
SVM是基于结构风险最小化原理的新型学习机。SVR是建立在SVM思想上,可用于解决回归问题的新型算法。SVR不但具有SVM的优点,而且其通过将数据映射到高维空间进行线性拟合,较传统非线性拟合方法具有更低的过拟合风险,但是SVR的理论优势取决于其关键参数惩罚系数C和核参数g是否合适。
C、和g这3种参数优选法的实现,都基于将SVR的模型结构及其预测算法嵌入对应的算法步骤中。网格搜索法(GRID)、遗传算法(GA)以及粒子群算法(PSO)作为成熟的优化算法,在理论上较高的精度和可靠性,且耗时更短。文章比较这3种优化SVR,并选取均方差(MSE)作为评判精度的指标:
(1)
式中,为新样本的估计值;n为样本数。
2 基于SVR的矿井气体预测模型
矿井气体组分浓度的定量分析是指在待测气体浓度或其他性质与测试仪器的测量结果之间构建定量关联关系。对红外光谱分析而言,则是用统计的方法在矿井气体组分的种类和浓度值与红外光谱数据之间建立一个关联模型(校正模型),应用建立的校正模型即可对待测气体组分浓度进行预测。定量模型建立之后,必须对其进行验证,以确保模型对光谱信息和样品浓度信息之间的回归关系表征正确,模型的预测能力满足定量分析的精度要求。
文章采用选用RBF核函数,分别使用GRID、GA、PSO算法进行参数优化,对甲烷、乙烷、丙烷等5种典型矿井气体的组分浓度进行回归预测。
3 不同算法下矿井气体定量分析结果对比
文章使用美国赛默飞世尔科技公司的Nicolet-Nexus870型傅里叶变换红外光谱仪,共测得186组模拟矿井气体的光谱数据,将其中136组作为训练样本,剩余50组样本数据作为测试集。用优化所得的C和g对校正集各维进行训练建立SVR校正模型,利用原始数据对模型进行回归验证。
通过计算得到,采用不同优化算法时的MSE值都小于0.06,且R值接近1,说明各模型的学习能力较好。为进一步评价各参数优选法对矿井气体组分浓度的预测性能优劣,对不同参数设置下模型的预测结果进行了对比(如表1所示),其中T为各SVR完成训练校正集以并获得预测结果参数所需的总时长。
由表1可以看出,3种SVR计算时长都在80 s以下,但PSO和GA的计算时长普遍短于GRID。甲烷、乙烷以及二氧化碳在混合气体中的浓度均能被这3种SVR实现较为准确的预测,其中相关系数R均大于0.9,且最小MSE都在0.02以下,而乙烷、丙烷的浓度预测误差则相对较大。由于烷类气体的红外吸收光谱在波段以及波峰吸收值上存在较大的重叠,丙烷和丁烷尤为严重,其预测结果如图1所示。
由图1可以看出,对于丙烷和丁烷,基于PSO优化模型明显优于其他两种算法,且其对丙烷和丁烷预测后所得均方差均低于其他两种算法,相关系数也高于其他算法优化的SVR,从而证明利用PSO优化SVR模型参数对(C,g)的适用性。
4 结语
矿井气体的红外吸收光谱能够反映其组分种类及其浓度的信息,但是烷烃类气体存在较为严重的波峰重叠,所以需要通过非线性建模的方法对其进行定量分析。SVR在对矿井气体红外光谱进行定量分析时,具有较高的精度;但是实现此优势的前提则是选取到最佳参数对(C,g)。经过试验分析,对现阶段较为常用的参数选择法如GRID、GA以及PSO的性能进行了对比,发现使用PSO优化的模型在对矿井气体的定量回归预测上的综合性能更好。
参考文献
[1]张国枢.通风安全学[M].徐州:中国矿业大学出版社,2007.
[2]王显政.煤矿安全新技术[M].北京:煤炭科学出版社,2002.
[3]梁运涛.煤炭自然发火预测预报的气体指标法[J].煤炭科学技术,2008(6):5-8.
[4]罗海珠,梁运涛.煤自然发火预测预报技术的现状与展望[J].中国安全科学学报,2003(3):79-81.
[5]Naoual Makhoukhia,Eve Pere.Determination of the composition of a mixture of gases by infrared analysis and chemometric methods[J]. Journal of Molecular Structure,2005(744-747): 855-859.