论文部分内容阅读
国家水资源监控能力建设项目于2012年开始实施,水资源监测在全国范围内迅速展开,通过实时监测能够获取到大量的监测数据,为水资源科学化、定量化、精细化的管理提供了坚实的基础。但是,由于外界环境干扰、监测设备故障等各种因素的影响,导致原始监测数据存在部分异常。水资源监测数据不能直接使用,数据的价值得不到充分发挥。为了提升水资源取用水量监测数据的价值,本文应用系统工程思想和数据分析技术开展以下研究。 (1)水量监测数据异常值分析与数据质量评价。以广东省的取用水量监测数据为例,对取用水量监测数据的异常情况进行分析并查找原因。为了评价取用水量监测数据的质量,构建数据质量评价指标体系,并建立数据质量评价数学模型。以广东省某地级市M市的取用水量监测数据为例,分别对自来水厂、火力发电厂、其他企业的水量监测数据质量进行了评价,结果发现自来水厂的数据质量相对火力发电厂和其他企业要好一些。 (2)历史水量监测数据异常值检测、校正和预测。对于时间序列数据的异常值检测和校正,提出了中位数-EEMD-曲线拟合方法,并利用公开数据进行验证,结果表明该方法能够有效检测出异常值,包括局部异常值。把中位数-EEMD-曲线拟合方法应用于历史水量监测数据的异常值检测和校正,经过异常值检测和校正后,获得更加可靠的数据,再应用贝叶斯神经网络和支持向量机分别对取用水量历史监测数据进行预测,并以自来水厂B1和电厂D103数据为例进行仿真实验,结果表明两种算法的预测性能都比较好。 (3)实时水量监测数据异常值检测和校正。提出了基于中位数-EEMD-曲线拟合-贝叶斯神经网络的取用水量实时监测数据的异常值检测、校正方法。应用中位数-EEMD-曲线拟合方法对历史监测数据的异常值进行检测和校正,然后用贝叶斯神经网络对即将上报的数据进行预测,通过计算预测值与上报数据的偏差比率,从而判断上报数据是否异常。若为异常,则用预测值替换上报数据。以自来水厂B1的数据为例进行仿真实验,结果表明该方法有效。 (4)取水总量计算与趋势分析。水量计算与趋势分析之前都需要经过异常值检测和校正。以M市的取用水量监测数据为例,把监测点分为自来水厂、火力发电厂、其他企业3类,根据监测数据的缺失比例,把监测点分为数据完整型和数据缺失型。对于数据完整型监测点,采用中位数-EEMD-曲线拟合方法对监测数据进行异常值检测和校正,然后再用校正后数据的平均值计算监测点的年取水量;对于数据缺失型,用中位数法筛选出正常数据,然后以正常数据的均值计算出监测点的年取水量。与原始数据的平均值计算出的年取水量相比,用本文提出的方法计算出的年取水量更加接近水利普查数据和取水许可证许可水量数据。对于数据完整型监测点,用EEMD方法对经过异常值检测和校正后得到的时间序列数据提取变化趋势,结果发现一年中大多数自来水厂的日取水量呈现先增后减的抛物线变化趋势,电厂和其他企业日取水量的变化趋势相对平稳。 综合以上四个方面的研究,总结出把系统工程思想与数据分析技术结合用于提升水资源取用水量监测数据价值而形成的一整套体系,包括异常值分析、数据质量评价、历史和实时数据异常值检测与校正、取水总量计算与趋势分析。通过本文的研究,充分证明了系统工程思想与数据分析技术能够有效提升水资源监测数据的价值。本文提出的方法可为水资源管理提供参考建议。