基于领域本体的个性化智能信息检索系统的设计与实现

来源 :华东师范大学 | 被引量 : 0次 | 上传用户:chenyikg21
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的不断发展及其应用的深入,Web俨然已经变成全球最大的虚拟资料库,可用的信息正呈指数级的增长。对于一个普通的用户,面对信息的海洋,要检索出所需要的文档变得越来越难。目前的Web信息检索系统大多是基于关键字匹配的搜索引擎技术,没有考虑到对检索关键词进行语义上的分析和处理,不能充分挖掘出用户的检索意图。并且,不同领域背景、知识结构的用户对文档相关性的判断也是不同的。Web信息检索技术应提供智能化、个性化、专业化的服务,才能更好地满足用户从Internet上有效获取信息资源的要求。 本体(ontology)是描述概念及概念之间关系的概念模型,通过概念之间的关系来描述概念的语义。由于本体具有良好的概念层次结构,因而在信息检索中得到了广泛的应用。本文首先对本体的相关理论进行了深入研究,探讨本体在智能信息检索中的应用。接着使用W3C的RDF/RDFS技术构建了领域本体,提出了一种计算本体语义相关度的方法,在信息检索领域,利用语义相关度的计算方法,量化了概念之间的关系,可以使用查询关键字扩充和修正技术,通过和用户的交互,改进查询的准确度。在此基础上,本文设计并实现了一个基于领域本体的个性化智能信息检索系统——OntoHelper,这个系统工作在客户端,利用计算本体概念相关度的方法,对检索关键词进行语义上的分析和处理,能够用来提高用户检索时的联想能力和精确性,系统采用了元搜索引擎的工作方式,同时对用户的兴趣偏好进行建模,综合使用“搜索引擎信任度评级”和“个性化评级”的计算方法来对检索页面进行排序。 与传统的搜索引擎方式相比,OntoHelper系统具有智能程度高和针对性强的特点,在信息检索时既满足了信息的广度需求又适应了用户个性化需求,适合于成为个人Web信息检索助手,有着很好的实际应用价值。
其他文献
现有的互联网是以TCP/IP协议为基础的分组交换网络,随着多媒体应用的日益广泛,它已远远不能满足实时多媒体数据传输的要求,因此,研究如何在现有互联网上进行实时多媒体数据传
数据中心接入的系统非常复杂,数据类别多,数据量大,所以必须有一种有效的机制把这些数据组织好。本文明确提出以主题的模式对数据进行管理,数据的提供者、使用者和管理者都可以通
学位
一直以来,软件工程界在如何减少软件工程师的工作量和提高工作产品的质量的问题上做着不懈地探讨和研究,用于解决这问题的新方法、新技术、新工具也不断涌现.一些应用程序框
计费管理是计算机网络管理的重要组成部分之一,而计费管理的关键是计费信息的采集。根据不同网络应用的计费需求,其计费信息的采集方法也不一样,本文分析了教育部电化教育大楼网
现阶段,因特网是使知识经济成为现实可行的技术工具,网上散布着丰富的信息资源,但是,这些资源是孤立存在的,形成信息孤岛,查找时非常困难,因特网上的信息只有经过有效的组织才能被充
21世纪是计算机和网络的世纪,Internet正以其庞大的用户数量和惊人的增长速度显示出旺盛的生命力.World Wide Web已成为Internet上最流行和最具潜力的信息查询、发布和交互方
近年来,软件复用已经成为软件工程领域中最重要的目标之一。设计模式(Design Patterns)因能提供相对对象更高层次的可复用性而成为软件工程领域又一突破性的软件开发新技术。
随着INTERNET的不断发展,人们的观念正越来越适应信息技术的进步,电子商务在这种背景下迅速地发展起来,然而,在电子商务交易过程中,由于交易双方并非面对面交流信息,电子商务
在20世纪的70-80年代,软件工程的研究重点是需求分析、系统设计、编程、测试、维护等领域的方法、技术和工具,称之为经典软件工程.但如今绝大多数的软件项目依然面临着质量低