论文部分内容阅读
随着沿海经济的迅速发展,排入海水中的氮磷等污染物逐年增加,近海富营养化趋势日益加剧.对近海富营养化状况进行实时评价是海洋环境监测的迫切需要.目前水质富营养化的评价方法较多,主要包括单因子评价法(TSI),及富营养化指数法(EI)、营养状态质量指数法(NQI)、富营养化状态指数法(IRIX)等综合指数法,使用的评价指标主要包括营养盐、COD、BOD、溶氧(DO)、叶绿素a(Chla)、浊度(Tur)等.由于营养盐、COD等参数的测定存在分析周期长、工作量大等特点,不利于富营养化的快速监测评价.有色溶解有机物(CDOM)是存在于水体中的一类含有富里酸、腐殖酸和芳烃聚合物等物质的可溶性有机物,与营养物质的生物地球化学循环密切相关.有研究表明CDOM的紫外可见吸收与COD、营养盐等水质参数有显著相关性.同时紫外可见光谱分析技术已广泛应用于在线实时监测.支持向量机(SVM)是由Vapnik等人根据统计学理论提出的一种基于结构风险最小化原则,通过引用核函数,将输入空间中的非线性问题映射到高维特征空间,借此转化成构造线性判别函数,在模式识别、图像处理、数据挖掘、回归预测等领域广泛应用.本文选取2013年7月黄东海航次的66个站位的294个水样为研究对象,选取能实时监测的溶氧(DO)、叶绿素a (Chla)、浊度(Tur)3个水质指标,及可在线监测的CDOM的特征吸收系数aCDOM (255)、aCDOM (270)、aCDOM (355)3个指标,以富营养化状态指数法中TRIX值为参照,利用支持向量机建立黄东海富营养化快速测评技术.首先,分析TRIX的数值特征可知,TRIX的平均值是5.65,变化范围在2.66和7.32之间变化,符合TRIX分类标准,即2<TRIX <4为极低营养化,4≤TRIX<5为低等营养化,5≤TRIX<6为中等富营养化,6≤TRIX<8为高等富营养化.本文选取的294个样品中2<TRIX <4范围内只有8个,为此定义2< TRIX<5为低等营养化;5≤TRIX<6为中等富营养化;6≤TRIX<8为高等富营养化.将294个样品分为3类,其中第一类为77个低富营养化的样品,第二类为94个中等富营养化样品,第三类为123个高富营养化样品.然后,使用径向核函数的支持向量机建立富营养化快速评价技术.从294个样品中随机抽取160个样品作为训练集,其余134个样品作为测试集,设置训练集和测试集数据进行[0,1]区间内归一化处理,运用主成分降维预处理,设置特征提取百分比为95%,利用网格寻优方法、遗传方法和粒子群方法建立支持向量机分类模型,并对这3种方法进行实验比较,选择最优的参数选择方法,采用k-cv交叉验证的算法确定惩罚参数和核函数参数的最优值.在参数选优的过程中,网格寻优的结果最好,故本文建立黄、东海支持向量机分类技术时采用基于k-cv交叉验证算法的网格寻优方法.结果表明,以溶氧(DO)、叶绿素a (Chla)、浊度(Tur)及CDOM的特征吸收系数aCDOM (255)、aCDOM (270)、aCDOM (355)参数为评价指标,以富营养化状态指数法中TRIX值为参照,基于支持向量机建立的黄东海富营养化快速评测技术,网格寻优的参数选择结果如图1,由此可知惩罚参数C为45.3,核函数参数g为1.4.测试集的实际分类与预测分类如图2所示,训练集分类准确率为93.1%,测试集分类准确率为82.8%,交叉验证准确率为88.1%.所建立的技术可为实现近海富营养化状态现场快速测评提供技术支持.