论文部分内容阅读
随着信息技术的不断发展,互联网中海量的资源,在为网络的使用者提供各种各样的信息的同时,也由于其信息来源与构成的复杂与多样性,使得用户在获取信息的同时,也往往不得不忍受各类非相关资源,甚至垃圾信息的困扰,严重影响信息获取效率。因此信息检索技术已经成为许多网上系统中不可缺少的重要组成部分,而很久以来,相当多的的网络信息查询系统采用的是传统的信息检索技术,即基于简单的字符匹配的信息检索。在面对大量的待检索资源和与检索目标在内容上具有直接或间接关联资源时,这种技术的检索效果往往不能令人满意,检索结果中很可能包含一部分与检索目标非相关的资源信息,而许多相关的资源却会被遗漏。 随着城市的快速发展,城市规模迅速扩大,交通也日趋复杂,传统交通旅游地图上密如蛛网,相互交织的道路,上百条公交线路,成千的地名站点以及寥寥几句的景点信息,使得外地游客往往要在出行前花费大量的时间与精力研究出行路线与游玩地。即使利用搜索引擎从网络中检索相关信息,则必须根据所要查询的信息,多次输入查询语句,并要从可能数以百计的返回的资源中,一一寻找用户想获得的信息,即使如此,对于某些特殊的信息,搜索引擎也未必能有其用武之地,例如,对于公交线路的换乘,两景点间最佳路径的选择。于是相比之下专业领域的信息查询系统在处理此种信息查询时具有更强大的功能。因此对于待检索资源内容有一定“理解,识别以及推理”能力的检索技术的需求日益突出。 针对以上问题,语义WEB的提出与发展为实现具有“理解,识别以及推理”能力的语义检索的实现提供了一种可行方法。本文在总结语义WEB与语义检索的研究现状的基础之上,着重研究了在语义WEB中的关键两层:Ontology模型与OWL一种目前流行的语义WEB描述语言,并描述了利用protégé平台,构建专业领域本体模型的过程及其基本结构组成,然后叙述了利用HP公司开发的基于Java的语义WEB的检索语言——JENA,所搭构建的“公交站点查询系统”的语义推理系统的功能与实现原理,接着描述了结合Lucene,JENA以及基于VSM改进的分值过滤技术的文本语义检索系统,使得本文所描述的此专业领域信息查询系统相较于只使用传统检索技术的查询系统在检索结果的查全率与查准率上有明显的提高。