论文部分内容阅读
近年来,空气污染问题愈发严重,已经成为全球性问题。空气质量监测是应对空气污染的重要手段。国家建立了多个空气监测站点来实时监测空气污染状况,其数据准确度较高,但成本高昂,由政府部门统筹规划,部署较为稀疏。因此,通常使用较低成本的微型监测传感器设备构建大型传感器网络,实现密集化的区域监测。然而,由于受到交叉干扰和传感器老化等因素的影响,微型传感器设备读数会和标准浓度之间存在一定的偏差。为确保网络中传感器的数据质量,需要对这些微型传感器设备进行校准,目前校准任务面临较大挑战。为了解决以上的校准问题,本论文从两种角度出发,分别设计了基于浓度类别的多回归校准模型和基于时间序列的深度校准模型。论文的主要工作和创新点如下:(1)提出了基于浓度类别的多回归校准模型(CCA)。传统的校准模型通常只使用一种回归模型来构建传感器读数到标准浓度的映射关系。CCA根据污染物的浓度类别建立多个回归模型,以构建从传感器读数到参考读数的更准确的映射。此外,CCA引入了两个容错模块:分类容错和样本容错。前者减轻了分类模型错分的影响,后者提高了每个回归模型的鲁棒性。(2)提出了基于时间序列的深度校准模型(C-Net)。传统的校准模型是点到点结构,它常常难以挖掘时序数据之间的依赖关系。C-Net是基于注意力机制的编码-解码结构。C-Net的注意力机制位于编码器阶段,会根据先前的编码器隐藏状态在每个时间步选择相关特征序列,从而学习交叉干扰特征。此外,C-Net还具有单独的趋势特征提取模块用来提取的目标污染物的变化趋势特征。编码器的RNN模型会将提取的特征编码为固定长度的时序编码向量。解码器接收时序编码向量和历史参考浓度,从而得到最终的校准值。C-Net可以从有限的输入数据中挖掘有效的时序特征和交叉干扰特性,从而提高了校准精度。上述模型在两个城市(兰州和福州)的一氧化碳(CO)和臭氧(O3)真实数据集中进行了评估。实验表明,CCA能够有效提高回归模型的性能,其容错策略因为其灵活性和有效性保证了CCA的鲁棒性。C-Net在多数数据集上的效果要远远好于传统的基于回归的方法。