Web挖掘在搜索引擎个性化中的应用研究

来源 :合肥工业大学 | 被引量 : 0次 | 上传用户:zhangsanzong
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet的发展与普及,网上信息量的急剧膨胀,Web己成为人们获取信息的一个重要途径,使得搜索引擎成为辅助网络信息检索的重要工具。Web挖掘为实现个性化信息检索提供了技术支持,利用用户兴趣向用户提供个性化服务已经成为Web应用领域的一个研究热点。本文针对Web挖掘在搜索引擎个性化中的应用进行研究,主要工作如下:首先,本文阐述了搜索引擎现状及存在的问题,提出了个性化搜索引擎的重要意义。分析了搜索引擎工作原理、组织结构及各部分功能,并对向量空间模型进行了详细的研究。其次,论文介绍了Web挖掘的定义、任务及与信息检索的关系,研究了Web挖掘技术及Web内容挖掘、结构挖掘和使用挖掘在搜索引擎中的应用。详细讨论了基于用户浏览行为获取用户兴趣的方法,提出了对向量空间模型(VSM)改进方法,研究了用VSM构建初始的用户兴趣模型,然后根据用户浏览行为自动学习用户兴趣并对其模型进行更新及个性化信息过滤等关键技术。另外,针对大量同义词的存在,为了提高检索覆盖率,建立同义词词典,以扩充检索词来对查询语句进行优化。最后,在上述研究的基础上,设计了一个基于Web挖掘的个性化搜索引擎模型PSE,给出了各模块的功能及实现方法,从理论上分析该个性化搜索引擎具有灵活的检索方式和个性化的查询结果等特点。论文结尾,对本文所做的工作进行了总结并对个性化信息检索的发展进行了探讨。
其他文献
虚拟专用网VPN是网络互联技术和通信需求迅猛发展的产物。互联网技术的快速发展及其应用领域的不断推广,使得许多部门越来越多地放弃建设昂贵的专用物理连接设备架设专用网络
随着Internet和信息技术的飞速发展,个性化推荐作为一种崭新的智能信息服务方式,根据用户提出的明确要求,或通过对用户个性、习惯、偏好的分析,准确地向用户提供感兴趣的信息
现有的数据组织系统中的索引机制大多是基于传统数据组织的通用索引,存在索引数据规模过大、索引时间过长、索引数据类别单一等诸多问题。这些问题导致海量数据检索在查全率
人们对访问控制技术的探索已拥有很长的历史,各种访问控制模型层出不穷。伴随当今互联网技术、电子技术、无线网络技术以及分布式网络技术的逐渐成熟,物联网和云计算等新一波
计算机视觉技术在智能交通系统中的应用已经成为一种新的发展趋势,而停车诱导系统是智能交通系统的重要分支,因此如何将计算机视觉技术应用于停车诱导系统中,便成为一个具有
数据集成是实现分布式协作开发环境中系统设计工具集成的关键技术之一其中,数据模型和数据格式的转换是数据集成的主要内容。扩展样式语言转换(eXtensible Stylesheet Langua
作为保证软件质量的重要手段,软件测试正在发挥日益重要的作用。传统的软件测试采用精简测试用例的方法来提高测试效率,但是测试用例的精简会降低发现缺陷的概率,影响测试质量。
随着科学技术的不断的发展,图书情报界为适应新技术的发展而产生了一系列令人振奋的新进展,基于开放获取(Open Access)理念的机构知识库就是其中之一。机构知识库是一种全新
在当代计算机系统中,处理器的速度远远高于存储器的速度。Cache技术是提高数据访问性能的经典技术,在计算机系统的性能优化中发挥了重要的作用,但Cache同时也占据了计算机系
TSP问题(Traveling Salesman Problem),即旅行商问题,是数学领域里面组合优化问题中被广泛研究的著名问题之一。TSP问题在学术研究和实际生产需求中十分重要,同时在物理学、