论文部分内容阅读
随着传感技术、互联网、通信技术的高速发展,物联网的概念被提出来并且逐渐深入到人类的日常生活中。物联网的使用遍及各行各业,特别是在物流管理中已经得到很成熟的使用。之外,在货物监控、治安监控、智能交通、重点设施监测、环境监测、便民服务、工作监督、重大危险源管理中,也逐渐引入了物联网。无线射频识别(RFID)技术是支撑物联网发展的最重要的技术之一,国内外的众多研究机构和企业已提出了各种RFID系统的解决方案。在RFID技术的应用中,由于RFID数据的海量性、不确定性,RFID数据的有效处理面临极大挑战。RFID数据处理方面的研究主要是从数据清洗、管理、和挖掘等方面展开,其中数据清洗虽然已有大量的研究,但其中的一些问题,如不确定、动态环境下的有效数据清洗依然有待改进和发展。
本文针对动态环境,研究新型的海量RFID数据清洗处理模型和算法。具体研究内容包括:
1)分析几种经典的RFID数据清洗处理技术,包括基于阅读器滑动窗口的技术、管道模型清洗方法以及基于机器学习的清洗策略。一些基于机器学习的数据处理策略充分利用了历史数据信息;在DCA方法中,利用了对象之间在不同时刻的关系处理数据;
2)针对DCA方法的存在的模型缺陷及算法不完整的问题,通过改进数据处理算法,提出了可行而有效的E-DCA数据清洗处理模型;E-DCA方法利用了三类信息处理数据,一是最近周期内的历史数据,设定周期根据实际情况动态变化,保证数据是实时的;二是标签对象之间的关系,利用对象关联度可以提高数据处理的准确度;三是实际物理环境的约束,利用实际物理环境下的地理分区可以减少数据处理的时间。E-DCA数据处理模型,把数据处理过程分为五个步骤,本文重点研究其中的四个步骤,包括数据统计、关联度建立、不确定数据检测以及不确定数据处理。不确定数据指漏读数据和多读数据,处理的目的是对漏读的标签进行填补以及清除多余的数据。
3)设计模拟实验场景产生数据,实验验证E-DCA处理模型和清洗算法在时间、准确率、数据压缩率方面都有比较好的表现。