论文部分内容阅读
随着物联网的快速发展,很多实际应用中均需部署大量的感知设备来进行数据的采集及处理,从而对物理世界进行高质量监测,但由于这些硬件设备固有的限制以及所处环境等因素的影响,单一模态的数据往往不能完整全面的监测到物理世界的变化特征因此为了避免该问题的发生,本文引入多源多模态数据的概念,对不同的属性信息(也就是多源多模态数据)进行采集,从而获取更为准确的物理世界信息。此外,大部分的感知数据采集均基于等频采样方法,但对于连续变化的物理世界,在能耗受限的条件下,等频采样往往会忽略一些关键点,从而导致数据中关键信息的缺失,使输出的曲线失真。基于此,本文对多源多模态感知数据的变频采样技术展开了研究。首先,本文提出了一种基于多源多模态感知数据的变频采样技术。这个方法考虑到各个属性数据间所存在的相关特征,利用主成分分析模型找到一个能解释所有模态信息且无冗余信息的综合指标,并依据该指标的变化情况来确定下一个采集时刻,该方法的采样频率是随着综合指标变化而变化的,可以保证采集到关键信息点,从而使最终输出的感知曲线O(ε)近似于真实的感知曲线。在此基础上,本文中还对所采集的每一个模态数据进行数据质量准确性方面的定义,并根据该定义提出相应的数据优化改进方法,使各个模态数据质量最终也能满足用户在精度上的要求。最后本文利用真实数据与模拟数据对该变频采样方法进行测试,观察变频采样方法与等频采样方法的性能,最终验证出该变频采集算法的优越性。其次,考虑到传感器在感知环境信息时,周围环境不稳定以及自身能量问题等外界因素的干扰,感知数据中会掺杂一些异常数据,因此,为了避免该现象对最终结果的不利影响,本文还提出了一种针对多源多模态数据预处理方法。在本文中,我们利用多源多模态数据固有的优势,将前面主成分分析法所得到的多模态数据间的相关关系应用到绝对均值法当中,首先利用综合指标判断出异常点出现的时刻,之后,在该时刻找到各维数据中存在的一个或多个异常点,将其剔除并补入相应的估计值,从而得到更为准确的结论。通过实验验证,该采样方法可以基本去除所采数据中的野值点(outliers)。最后,本文提出了基于多源多模态感知数据的两种融合技术,将所采集到的数据以分类结化或决策的形式输出,以达到用户对模态数据不同类型的要求。与此同时,本文也对多源多模态感知数据融合后的分类结果进行数据质量准确性方面的定义。通过实验验证,可以比较出各个融合分类方法的好坏,以及结果准确性的影响因素。总之,本文基于物联网中的多源多模态感知数据,利用各个模态间固有的特性进行变频采样与融合技术的深入研究,保证最终数据质量在准确性方面较好。