论文部分内容阅读
无线射频识别技术(RFID)始于二战期间,现在已经广泛应用于物流、航空、供应链、医药等领域。由于其有条形码无可比拟的优点,如自动、快速、批量、远距离等等,电子标签(射频标签)大有取代条形码的趋势。另一方面由于RFID数据的不可靠,如漏读、多读、冗余等,又制约着它的应用,因此也给RFID数据管理技术带来了机遇和挑战。所以,如何有效地对RFID数据进行清洗成为亟待研究的重要课题。为了解决此问题,现有的技术通常考虑的是如何在数据层面利用滑动窗口来平滑过滤数据,或者是考虑目标对象间的时空关联性,或者数据的冗余性等。这些方法在数据清洗期间往往会填补上大量不必要的数据,并且其清洗结果远远没有达到理想的效果。本文首先对RFID技术发展历程进行了介绍;接着分析了RFID数据流与传统数据的异同点;然后回顾了现有RFID数据清洗技术并指出了其存在的问题和不足;在此基础上,本文对RFID数据流清洗技术进行了深入研究。为了满足在数据层进行数据清洗的需求,本文提出了两种数据填补策略:确定型数据填补方法与非确定性数据填补方法。前者包括时间间隔模型、包含关系模型和惰性模型,后者又称为正态分布模型。针对现有数据清洗模型的所存在的问题和不足,本文提出了基于读写器交流信息的RFID数据清洗策略。此策略提升到了逻辑层,能够大大减少冗余数据的产生。同时,RFID读写器的交流信息也是首次被用来解决数据质量问题。为了使交流信息正规化,设计了一种新的RFID读写器通信协议和一种动态概率细胞事件模型;基于以上的协议和模型,提出了一种主动的RFID数据清洗策略,包括冗余数据消除方法(D-DR)、漏读数据填补方法(Topk-PDI和M-PDI)、多读数据消除方法(P-DR)。为了评估本文提出的策略与算法的性能与有效性,本文设计了大量的仿真实验,实验结果不仅证明了本文提出的策略与算法的可行性和有效性,也显示它们具有实时性和精确性等优点。