论文部分内容阅读
RFID(Radio Frequency Identification)无线射频识别,是一种非接触自动识别和数据获取技术,目前,已经广泛应用于智能超市、供应链、图书管理、车辆管理等领域。RFID应用系统中会产生海量数据,而RFID路径数据是指贴有RFID标签的物体在移动的过程中产生的数据,从这些海量路径数据中挖掘出有价值的信息,对用户了解物品的移动规律和趋势,辅助相关业务安排与调整,发现异常移动等应用方面显得非常重要。在现有研究RFID数据挖掘方法的基础上,本文主要对RIFD路径相似性度量、RFID路径数据聚类、RFID频繁路径挖掘等方面做了深入的研究。针对RFID智能超市中的路径数据进行研究,实现了智能超市中RFID路径数据的获取,以路径的EPC作为键值按照时间相关性来整合路径信息,将整理后的路径数据分别从地点和时间维度上进行压缩,从而节省了存储空间。在RFID路径聚类方面,路径相似性计算是聚类算法的基础,本文利用位图技术,分别从RFID路径的地点和时间属性两方面计算其路径相似度。根据RFID路径数据具有数据流的特性,提出基于多粒度的时间滑窗聚类算法MTSWClustering(Multi-granularit-y Time Sliding Window Clustering)。此算法采用时间滑动窗口模型,按照时间粒度的不同将算法分为在线层和离线层。在线层算法按照RFID路径事件类型进行微聚类,离线层对在线层的聚类结果按照其相似度进行宏聚类。在RFID频繁路径挖掘方面,提出一种RFID路径数据流滑动窗口的top-k闭路径挖掘算法TCFP-Tree Mining(Top-k Closed Frequent Path Mining)算法,设计了TCFP-Tree来存储滑动窗口中的概要数据及发现的候选闭路径。算法采用深度优先搜索的方式进行闭路径模式挖掘,在挖掘的过程中,采用项集合并和前缀模式跳过等技术来提高挖掘效率,动态的调整挖掘阈值和剪枝阈值,结合哈希结构进行闭合路径的判别,有效地实现了滑动窗口top-k闭路径挖掘。本文使用的RFIDTango系统,能够模拟智能超市情景,产生RFID路径数据供算法使用。通过实验验证了MTSWClustering算法和TCFP-Tree Mining算法都适用于RFID路径数据,实验结果表明,两种算法都能够有效的节省时间和空间资源。