论文部分内容阅读
在结构健康监测数据中存在大量数据丢失的现象,丢失数据的修复是进行监测数据分析与挖掘的首要任务。对于局部短时段丢失的时程数据,现已发展起来的基于压缩采样原理的丢失数据修复技术能获得较好的修复效果,但是该方法目前还无法有效地修复长时段丢失的时程数据(如某传感器一天的监测数据)。对于全天丢失的监测数据,一般是根据经验或其他先验知识从本传感器所测的往日数据中选择一条相似的时程以替补丢失的时程数据,但直接替补修复的数据与真实数据即使趋势一致也无法满足峰-谷值变化同步。本文提出了基于Copula多变量建模技术融合当日其他传感器监测数据和本传感器往日监测数据的丢失数据修复方法。该方法采用先修复分布再修复时程的两步修复法。首先,利用协作传感器当日监测数据与往日监测数据的匹配结果确定最优替补日(本文假设丢包传感器在该日监测数据正常);然后,利用Copula理论建立最优替补日内丢包传感器和协作传感器监测数据的相关结构,以丢包传感器最优替补日的数据分布为底分布建立混合Dirichlet模型以修复丢失数据的边缘概率分布模型,利用拟合的Copula函数组合协作传感器当日监测数据边缘分布和丢包传感器的某条替补分布样本建立二者的联合分布,再利用该联合分布获得丢包传感器关于协作传感器在数据丢失当天的条件分布;最后,以协作传感器当日监测时程任一时刻的数据为已知条件从丢包传感器关于协作传感器的条件分布中随机抽取一个样本作为对应时刻丢包传感器丢失数据的一次修复。该方法能有效地修复长时段丢失数据,且与实际丢失数据的波动特征具有较好的协调性(表现为峰-谷值同步)。