论文部分内容阅读
随着计算机网络和无线射频识别(RFID,Radio Frequency Identification)开环应用的普及,RFID搜索技术已经成为一个研究热点。由于RFID电子标签的容量十分有限,因此大量的RFID数据存储在互联网中。在这里我们给出一个定义:RFID接入设备采集到的业务信息,按照约定的协议,通过各种RFID信息服务与互联网连接起来,提供给用户应用,以实现智能化的物品识别、定位、跟踪、监控和管理的一种网络称为“RFID网络”。RFID网络中的业务信息包括物品的静态数据(物品本身固有的各项属性,数据,指标)和动态数据(物品在RFID网络的物流供应链中的流动情况)。为了使得用户能够在庞大的RFID网络中及时地检索到满足要求的物品静态数据和动态数据,需要建立基于RFID网络的搜索引擎。
本文在RFID技术和相关标准以及互联网搜索引擎技术等的研究基础之上,结合多项工程实践,在搜索引擎数据采集、数据处理和查询模式等方面,对RFID搜索引擎开展了深入的研究和开发工作。主要包括以下内容:
1.给出了一种RFID搜索引擎数据采集模式。与互联网搜索引擎爬虫可以随意抓取网站上的网页数据不同,RFID网络中的信息数据必须要通过访问所在企业提供的数据接口才可以获取,而不同企业提供的数据接口是不同的。因此,本文给出了一个信息服务数据接口的统一规范和一套基于PMI。的数据交互的统一规范,RFID网络中的各个企业需要按照相关规范自行实现一个信息服务接口供搜索引擎服务器调用采集数据。
2.设计了高效的存储和索引模式。针对RFID网络中物品种类繁多,且物品静态数据的属性和内容较多的情况,设计了一种可以索引全部静态数据、但不需要存储全部内容的高效数据处理模式。
3.针对静态和动态两种数据的不同特点,以及用户的检索习惯和方式,设计了两种查询模式,并且在动态数据检索上设计了二次查询的流程,在用户体验方面给予较好的支持。
4.在以上设计的基础之上,基于开源文本检索工具Lucene,实现了一个RFID搜索引擎的原型,并给出了相关的实验和性能分析。实验中主要分析了两项指标:检索的准确性和多线程压力下的检索响应速度。
5.针对“北京志愿者卡管理系统”项目的需求,将RFID搜索引擎的检索服务应用于该系统,可以通过检索服务查询全北京市140万志愿者的信息,以及志愿者的活动轨迹。