基于XML的个性化搜索算法研究

来源 :河北工业大学 | 被引量 : 0次 | 上传用户:csy355
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着计算机以及网络技术的发展,Internet目前已经成为人们获得所需信息的重要来源之一,然而网络中存在的大量信息在给人们带来方便的同时也带来了许多的问题,越来越多的个性化信息需求使得搜索引擎中个性化搜索服务引起了人们更多的关注。在这种情况下,论文提出了一个面向Web的基于XML的个性化搜索系统模型,主要研究了实现系统的关键算法,论文所研究的内容属于信息搜索与电子商务方面的重要研究课题,具有一定的理论和实际应用意义。   论文首先研究了目前国内外搜索引擎系统的系统及其实现技术,分析了搜索引擎系统的主要结构和存在的主要问题,并在此基础上探索了个性化搜索系统所涉及的关键技术和具体算法,主要围绕在个性化搜索引擎的系统结构、用户兴趣模型的更新算法和相关分析排序算法三个方面进行。   首先在分析搜索引擎结构以及主要存在问题的基础上,提出了个性化系统实现的基本结构,并分析了其实现的关键技术;然后在构造个性化搜索原型系统的过程中,结合统计规律,确定了以提高查准率为主要目标的实现思路,改进了用户个性化兴趣模型更新的算法,将一般反馈方法与基于语义与词频统计的反馈算法相结合;最后在结果排序的过程中,结合用户个性化兴趣模型,改进了相关排序算法,并拓展了相关分析方法的应用领域。理论分析和实验结果表明,构造的个性化搜索原型系统是可行和有效的。  
其他文献
遗传算法是模拟生物界的进化过程而产生的一种现代人工智能算法,它具有天然的并行性,在求解复杂、大规模、非线性、不可微的优化问题中具有较高的性能。当今单核计算机现在已
万维网信息的爆炸式增长使Web已经成为世界上最大的信息库。面对这个海量、异构、半结构化的信息库,Web用户经常发现要查找到所需要的信息需要耗费大量的时间,造成了“信息过
人工蜂群算法(Artificial Bee Colony Algorithm, ABC)是一种受蜜蜂采蜜行为启发产生的新型群体智能优化算法。由于控制参数少、易于实现、计算简洁等特点,近年来ABC算法备受
随着Internet技术的发展,万维网上的文档数目成指数级增长,在如此浩瀚的信息库中,用户非常难找寻到自己所需要的信息。因此如何自动且高效地处理这些海量文档信息成为目前重
实验室信息管理系统(Laboratory Information Management System,缩写为LIMS)是利用计算机网络技术、数据存储技术、快速数据处理技术来对实验室进行全方位管理的计算机软、
无线传感器网络是当前通信和计算机领域的研究热点。目标跟踪是无线传感器网络中的一项重要应用,在军事和民用上都具有广泛的应用前景,也是技术上具有挑战性的课题。   目前
如今搜索引擎是一个十分活跃的话题和领域,在世界各地都能看到搜索引擎的身影。   搜索引擎已经成为信息产业一个重要的支撑,作为搜索引擎重要组成部分的网络爬虫也日渐受人
自计算机诞生以来,软件开发经历了从机器语言、汇编语言到高级语言的发展过程,抽象层次越来越高,开发人员也越来越多地关注问题本身而不再是一些技术上的实现细节。针对软件
随着存储系统规模的不断增大,存储系统的访问性能、能量消耗及数据可靠性等问题变得越来越显著突出。为了针对上述问题提出有效的解决方案,研究者需要搭建不同结构的磁盘阵列
随着社会经济的快速发展,各类企业层出不穷,伴随着企业的越来越多,商标作为企业的标志越来越受到重视,而商标的设计成为企业发展的重要环节。商标是商品的生产者经营者在其生