论文部分内容阅读
近几年,非接触的射频识别技术(Radio Frequency Identification,RFID)已成为人们生活中不可或缺的一部分,凭借着自身体积小、远距离通信、无线识别、具有一定存储能力且无需经常人工维护等诸多特点,RFID成为信息数据收集领域的重要部分。随着我国物联网(Internet of Things,IoT)产业的飞速发展,RFID已广泛地应用于包括,管理供应链、跟踪牲畜、防止假冒、门禁系统、自动结帐以及图书馆书籍跟踪等诸多领域。无源RFID系统具有无需内置电池、无线识别、成本低等优势,使其成为商场购物数据分析的重要技术。本文将RFID系统应用于商场购物数据的深度分析,通过对商品各个状态的实时信息采集和分析,挖掘顾客的感兴趣商品和相关的商品,以及商场的热点区域。为商场针对性地进货、促销、以及商店布局提供了科学的理论依据,进而能够根据客户的喜好推荐相关产品,为顾客提供更高质量的服务。但如何在海量标签同时存在,同时移动的情况下,准确、高效完成购物数据的收集和分析是难点问题。现有的多数数据分析算法时延大、能耗大且算法复杂不易实现,都很难高效、可靠且具有针对性地解决商场购物数据准确、深入分析的问题。本文提出的购物数据分析算法,针对性地解决了超市购物数据深入分析问题。首先使用阅读器收集无源RFID标签的相位信息,将收集的相位信息转换为商品的相对移动速度。其次,考虑到密集放置的RFID标签间的相互干扰,针对性地找出了在大型场所中密集放置RFID时的变化规律,并在此基础上对k最邻近算法(k-Nearest Neighbor,kNN)做出改进,提出了改进的k NN算法(Improved k-Nearest Neighbor,I-kNN),利用I-kNN对收集到的相对移动速度序列进行分析,对不同状态商品进行分类。之后,利用层次聚类(Hierarchical Agglomerative Clustering,HAC)算法将训练样本集中的每个数据点都当做一个聚类,通过计算两个聚类之间的距离,不断地将速度相近的商品进行合并,识别出各类别商品的相关性。最后,利用现有的商用设备,对所提出的系统建立原型,并进行了算法的实现和性能评估。结果表明,我们的方法在购物数据分析算法在实际中是可行的,在计算量和时间延迟方面明显优于其他算法。