论文部分内容阅读
地下水污染常常具有存在的隐蔽性和发现的滞后性特点,导致人们对于地下含水层中污染源的状况(包括污染源的位置、分布形态和释放历史),都缺乏了解和掌握,这给地下水污染修复方案的合理设计、污染责任的准确认定和污染风险评估都带来了很大的困难。因此,地下水污染源识别的研究具有重要的实际需求。地下水污染源识别是指根据地下水污染的现场实际监测数据(水位和污染质浓度监测数据),以及现场调查和专业经验等辅助信息,对描述地下水污染的数学模拟模型进行反演求解,从而识别确定地下含水层中DNAPLs污染源的状况,包括污染源的位置、分布形态和释放历史。地下水污染源识别问题在数学上属于数学物理反问题或称数学物理反演问题,反问题大都具有不适定性和非线性的特点,这也是反问题的难点之所在。随机统计方法和优化方法是目前地下水污染源识别的两种主要方法,以往研究通常单独使用其中一种方法进行识别。每种方法都有各自的优势和局限性。其中,优化方法的精细化搜索能力较强,但对初值的选择具有较大的依赖,若初值离真值较远,则收敛速度会非常缓慢,或易陷入早熟收敛,导致很难获得最优解。随机统计方法不仅能为待识别变量提供点估计,还能提供区间估计和概率分布估计。但在面临较为复杂的问题时,随机统计方法精细化搜索能力较弱,识别精度仍有待提高。为了取长补短,本文探索联合应用随机统计方法与优化方法,将两种方法优势互补,研制组合启发式搜索方法,进行地下水污染源识别。一方面,利用随机统计方法提供的点估计和区间估计的结果,为优化方法提供更好的初值和初估区间。另一方面,利用优化方法(建立并求解污染源识别的优化模型)增强精细化搜索能力,获得精度较高的全局最优解,提高识别精度。本文通过数学物理正反演、深度学习及组合启发式搜索方法等理论和方法的交叉融合应用,对地下水重非水相流体(Dense non-aqueous phase liquids,DNAPLs)污染源识别研究前沿中尚待解决的科学问题开展研究。在地下水污染源识别的实际问题中,常常可以将污染源概化为一个点(呈点状分布)。但是,有的实际问题则不然,污染源的分布难以概化成点状,如有的污染源呈较长的线状分布,对于这种情形如果仍按点状处理,会严重脱离实际。当面对这种情况时,则需对地下含水层中污染源的分布形态进行识别。本文以某染料化工污染场地为实例研究区,在现场调查和资料分析的基础上,判定污染源分布形态较为复杂,难以将其概化为一个点,必须考虑污染源分布形态的识别。因此,在这种情形之下,本文对地下含水层中DNAPLs污染源的位置、分布形态和释放历史及地下水DNAPLs污染多相流模拟模型参数进行联合识别。本文在对实例研究区进行现场调查和资料分析的基础上,对研究区水文地质条件进行定性分析和概化,建立研究区的概念模型。在概念模型的基础上,初步建立地下水DNAPLs污染多相流数值模拟模型。然后,对多相流数值模拟模型中的参数进行灵敏度分析,挑选出对模型输出影响较为显著的参数作为待识别参数,将待识别参数与污染源状况一同作为待识别变量。在求解地下水DNAPLs污染源识别问题的搜索迭代过程中,需反复多次调用求解多相流数值模拟模型,这会带来庞大的计算负荷和冗长的计算时间。本文通过建立多相流数值模拟模型的替代模型来解决这一问题。替代模型既能大幅度减少反复调用模拟模型所带来的计算负荷,又能保持较好的计算精度。运用拉丁超立方抽样方法在待识别变量的可行域内进行抽样,将抽样结果依次输入到多相流数值模拟模型进行正演计算,获得多相流数值模拟模型的输入-输出样本数据,作为建立替代模型的训练样本与检验样本数据。分别运用高斯过程方法、核极限学习机方法、深度置信神经网络方法和栈式自编码器神经网络方法,建立多相流数值模拟模型的高斯过程替代模型、核极限学习机替代模型、深度置信神经网络替代模型和栈式自编码器替代模型。利用训练样本,训练四种替代模型。利用检验样本,分析考察四种替代模型对多相流数值模拟模型的逼近精度,通过对比分析出栈式自编码器替代模型的优势和适用性。本文联合应用随机统计方法与优化方法,将两种方法结合运用,研制组合启发式搜索方法,用于地下水污染源识别研究。首先,在随机统计方法部分,设计构造启发式搜索迭代过程。建立基于贝叶斯公式和栈式自编码器替代模型的状态评估函数。应用变半径自由搜索方法,选择确定每轮迭代的尝试点。对于每轮迭代,根据基于状态评估函数的Tsallis公式的计算结果进行判别,如果满足状态转移的条件,则进行状态转移,将本轮迭代的尝试点作为下一轮迭代的出发点;若不满足,则需再运用变半径自由搜索方法,重新选定本轮迭代的尝试点。当迭代达到收敛条件时,获得待识别变量的点估计、区间估计和概率分布估计。利用随机统计方法提供的点估计和区间估计的结果,为优化方法提供更好的初值和初估区间。根据随机统计方法提供的区间估计和概率分布估计,重新抽取栈式自编码器替代模型的训练样本和检验样本,重新建立精度更好的栈式自编码器替代模型,并将其作为等式约束条件嵌入到优化模型,从而实现随机统计方法与优化方法的连接。然后,在优化方法部分,建立地下水DNAPLs污染源识别的优化模型。为了提高优化模型的求解精度,引入变概率迁徙策略和粒子群优化算法中的信息共享机制,对菌群觅食优化算法加以改进,构建变概率混合粒子群菌群觅食优化算法。最后,应用变概率混合粒子群菌群觅食优化算法求解优化模型,获得地下水DNAPLs污染源状况和多相流模拟模型参数的识别结果。通过上述研究,得到以下几点主要结论:(1)本文对某实例研究区地下含水层中DNAPLs污染源的位置、分布形态和释放历史及地下水DNAPLs污染多相流模拟模型参数进行联合识别。对于无法概化为点状的复杂污染源,本文开展了污染源分布形态的识别研究,刻画出实际污染源的真实分布形态,使得污染源分布形态的识别结果更加切合实际。(2)本文分别应用高斯过程方法、核极限学习机方法、深度置信神经网络方法和栈式自编码器神经网络方法,建立多相流模拟模型的替代模型。通过对替代模型不同建模方法的分析检验,结果表明,基于深度学习的栈式自编码器替代模型和深度置信神经网络替代模型对模拟模型的逼近精度,明显高于基于浅层学习的高斯过程替代模型和核极限学习机替代模型。其中,栈式自编码器替代模型对多相流模拟模型的逼近精度最高,能较好地拟合多相流模拟模型输入输出之间的复杂非线性映射关系。(3)本文通过随机统计方法与优化方法的联合应用,研制出一种组合启发式搜索方法,既能充分利用随机统计方法提供的点估计和区间估计的结果,为优化方法提供更好的初值和初估区间,又利用优化方法增强了精细化搜索能力,改善了搜索效果,提高了识别精度。(4)在随机统计方法中,本文采取两项改进技术,改善搜索的效果。一是应用变半径自由搜索方法选择确定每轮迭代的尝试点,通过不断调整搜索半径大小,兼顾了搜索的遍历性和效率。二是构建了基于状态评估函数的Tsallis公式,将其计算结果作为状态转移的判别依据,通过对Tsallis公式中控制参数的调节,使搜索过程在遍历性与效率之间找到了一种平衡。(5)在优化方法中,为了提高优化模型的求解精度,本文探索引入变概率迁徙策略和粒子群优化算法中的信息共享机制,对菌群觅食优化算法加以改进,构建了变概率混合粒子群菌群觅食优化算法,既能避免算法陷入局部极值,又能快速搜索到全局最优解,提高了优化模型的求解精度。综上所述,本文对地下水DNAPLs污染源识别进行了创新性研究,丰富了地下水污染源识别的理论基础,并为地下水污染修复工程的实际应用提供了技术支持。