论文部分内容阅读
作为一种自然资源,地球上只有百分之三的水是淡水。根据我国国情,淡水资源人均较少,即我国是严重的缺水大国。各个地区的城市化建设步伐加快,环境污染问题也逐渐突显出来,污染问题在水体上主要表现在点源污染和非点源污染上面,前者主要为管道排水,容易控制和管理,非点源污染则由于雨水的冲刷,农村肥料的流失等问题所造成的再污染影响到了淡水资源的纯净。因此,非点源污染的负荷预测问题成为了学术界较为重要的研究对象。较早以前专家针对污染问题提出了较多的成熟模型,但由于我国相关研究起步较晚,数据量不足,难以使用成熟模型进行负荷预测。随着人工智能和机器学习算法的发展,这些新兴的方式能够用少量数据即可得到较为准确的模型,为我国非点源负荷预测提供了新的思路。人工蜂群算法由于其需要的超参数少,结构简单以及易于实现等优点在提出以来就受到了广大科研人员的关注。算法被广泛的应用到了数值最优化、工业工程等领域,并获得了良好的效果。但是原始人工蜂群算法依然有着一些缺陷,如收敛速度慢,容易陷入局部最优解等等。针对原始算法的这些问题,本文对其进行了改进:在雇佣蜂搜索阶段,本文将细菌觅食算法中的趋化行为操作与之相结合,使雇佣蜂能够在搜索的过程中进入一个相对较大的范围,从而提高了算法的探索能力;在跟随蜂跟随阶段,本文借鉴粒子群优化算法中追随当前最优解的原则,将其更新方式引入原算法中,提高了算法的收敛精度。最后将改进的算法与其他算法进行对比,通过测试函数的收敛结果表明改进后算法的性能得到了大幅度的提高。极限学习机(ELM)作为一种新型的前馈神经网络,具有训练速度快,精度高等优点。但其隐层节点参数是随机给定的,从而造成了ELM在训练过程中需要大量隐层节点的后果。本文提出了一种改进的人工蜂群算法优化的极限学习机(HABC-ELM)。算法在人工蜂群算法的基础上引入了细菌觅食算法中的趋化行为和粒子群算法追随当前最优解的行为,改进了人工蜂群收敛速度慢等缺点,再使用改进的人工蜂群算法计算ELM的隐层节点参数。将HABC-ELM应用于回归和分类数据集,并与其他算法进行比较,通过对比RMSE和分类准确度发现改进算法较优。针对非点源污染的负荷预测问题,本文使用了上述改进的人工蜂群算法对极限学习机的连接权值和神经元阈值进行优化,并对中华人民共和国环境保护部数据中心中无锡沙渚断面水质数据进行非点源污染负荷预测。在对原始数据经过异常处理和归一化处理后,使用固定窗口滑动模型对训练数据集进行完善,最终将处理完成的数据放入优化前后的模型中进行训练,训练完成后使用测试数据集进行测试,通过对比RMSE和分类准确度表明,改进的模型较原算法有更好的效果。