论文部分内容阅读
射频识别(RFID)技术是一种非接触自动识别技术,该技术凭借标签体积小、成本低、非接触识别、自动识别等特点,已广泛应用于多个领域。但是,由于易受外部环境的干扰和射频信号的不稳定,阅读器所产生的数据通常是不可靠、不完全和有噪声,其主要表现为漏读和交错读现象。如何正确恢复RFID数据流中的数据已成为RFID中间件急需解决的重要课题。本文首先对RFID数据流的特征进行了详细分析,指出RFID数据具有简单性、关联性、时态性和空间性、不确定性(包括漏读和交错读),并对相关技术包括数据流窗口模型、数据流挖掘技术、RFID数据流恢复技术等方面的研究现状进行了详细介绍与分析。为了更准确地恢复RFID不确定数据,本研究提出了一种综合考虑多种因素的RFID不确定数据流恢复方法。该方法主要包括三个步骤:
第一,运用基于PFP-tree树的不确定数据流挖掘方法挖掘RFID数据流中的概率频繁模式。该方法通过设置数据项索引表和事务索引表,能够快速有效地进行频繁模式挖掘。该方法还运用了衰减窗口模型,通过区分“老”事务和“新”事务的贡献度,保证了该方法具有较高的模式召回率。
第二,基于所挖掘的概率频繁模式,通过计算标签对象之间的关联度,确定最大关联标签。而且,通过计算概率相似运动轨迹,确定最相似运动轨迹标签。基于这些信息,采用基于多元统计分析的不确定RFID数据流恢复方法--RR方法进行恢复。该方法综合考虑了标签的当前窗口信息、标签前一窗口信息、最大关联标签信息及最相似轨迹标签信息等四个因素,根据标签矢量的欧式距离判定标签的真实位置。
第三,由于RR方法可能存在误判现象,我们通过统计标签与阅读器的拒真率和交错读率,运用贝叶斯修正方法校正标签位于阅读器范围的概率,为后续窗口的准确恢复提供更为准确的后验概率信息。
第四,通过大量的实验分析和比较,证明基于PFP-tree树的概率模式挖掘方法比基于SUF-growth的方法具有更好的性能,以及所提出的RR恢复方法比SIS方法具有更高的恢复准确率。