基于Lucene的RFID搜索引擎的设计与实现

来源 :北京大学 | 被引量 : 0次 | 上传用户:fkj1022
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机网络和无线射频识别(RFID,Radio Frequency Identification)开环应用的普及,RFID搜索技术已经成为一个研究热点。由于RFID电子标签的容量十分有限,因此大量的RFID数据存储在互联网中。在这里我们给出一个定义:RFID接入设备采集到的业务信息,按照约定的协议,通过各种RFID信息服务与互联网连接起来,提供给用户应用,以实现智能化的物品识别、定位、跟踪、监控和管理的一种网络称为“RFID网络”。RFID网络中的业务信息包括物品的静态数据(物品本身固有的各项属性,数据,指标)和动态数据(物品在RFID网络的物流供应链中的流动情况)。为了使得用户能够在庞大的RFID网络中及时地检索到满足要求的物品静态数据和动态数据,需要建立基于RFID网络的搜索引擎。   本文在RFID技术和相关标准以及互联网搜索引擎技术等的研究基础之上,结合多项工程实践,在搜索引擎数据采集、数据处理和查询模式等方面,对RFID搜索引擎开展了深入的研究和开发工作。主要包括以下内容:   1.给出了一种RFID搜索引擎数据采集模式。与互联网搜索引擎爬虫可以随意抓取网站上的网页数据不同,RFID网络中的信息数据必须要通过访问所在企业提供的数据接口才可以获取,而不同企业提供的数据接口是不同的。因此,本文给出了一个信息服务数据接口的统一规范和一套基于PMI。的数据交互的统一规范,RFID网络中的各个企业需要按照相关规范自行实现一个信息服务接口供搜索引擎服务器调用采集数据。   2.设计了高效的存储和索引模式。针对RFID网络中物品种类繁多,且物品静态数据的属性和内容较多的情况,设计了一种可以索引全部静态数据、但不需要存储全部内容的高效数据处理模式。   3.针对静态和动态两种数据的不同特点,以及用户的检索习惯和方式,设计了两种查询模式,并且在动态数据检索上设计了二次查询的流程,在用户体验方面给予较好的支持。   4.在以上设计的基础之上,基于开源文本检索工具Lucene,实现了一个RFID搜索引擎的原型,并给出了相关的实验和性能分析。实验中主要分析了两项指标:检索的准确性和多线程压力下的检索响应速度。   5.针对“北京志愿者卡管理系统”项目的需求,将RFID搜索引擎的检索服务应用于该系统,可以通过检索服务查询全北京市140万志愿者的信息,以及志愿者的活动轨迹。
其他文献
RFID(Radio Frequency Identification,射频识别)公共服务体系用于在各个拥有RFID闭环应用的企业之间建立一套可靠高效的信息共享机制,包括物品的信息定位、跟踪与追溯、信息查询
学位
区别于传统的存储服务,P2P存储系统是通过够聚合网络上的空闲存储和带宽资源来提供存储服务,而不是基于数据中心。这使得P2P存储在当今具有重要的应用价值:一方面,随着数据中心规
学位
现代城市是一个影响因素繁多,内部关系极其复杂的系统。由于城市系统中各变量之间影响关系错综复杂,因此挖掘城市运行变量之间的隐含关系是城市规划领域中的一个重要研究方向
随着当代计算机技术和信息技术的不断发展和应用,数据收集手段越来越多,数据存储量越来越大,如何从海量数据中排除一些不会被用户考虑的信息并找出用户最感兴趣的信息,从而为用户
个体活动链包含了个体活动的时间、位置、次序和活动目的等信息,是理解个体时空行为特征的重要基础。从时空角度理解和分析个体活动链能够为城市人口管理、城市规划、交通分析
随着数字技术和因特网的发展,图像、音频、视频等形式的多媒体数字作品纷纷在网络上发布,其版权保护与信息完整性保证逐渐成为迫切需要解决的一个重要问题。隐写技术作为信息
溶解氧是指溶解于水中分子状态的氧,是水生生物生存不可缺少的条件,也是水污染和水体富营养化监测时的一项重要指标,对水质监测、水产养殖业的发展、饮用水安全等都具有非常
学位
科研活动中存在大量文档形式的资料。支持e-Science的协同工作环境不仅要能实现常规的文档共享和管理,还需充分发挥在线协作的优势,能够对大量多种格式的文档进行即时在线浏览
信息技术的飞速发展给数据保护提出了越来越高的要求。传统的数据保护技术无法很好解决备份时间窗口、恢复时间窗口及恢复时间点粒度这三者之间的矛盾关系,持续数据保护(Cont
学位
跨文本命名实体同指是指出现在多个文本中的相同名字指称现实世界中的相同对象。同指消解则是判断相同的名字是否指称相同对象的过程。跨文本同指消解对于多文本摘要和信息融
学位