基于用户兴趣挖掘的搜索引擎个性化研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户：huahua7717

【摘要】

：

随着互联网技术的迅速发展，Internet为人们提供了极其丰富的信息资源，在这些海量、异构的Web信息资源中蕴含着具有巨大潜在价值的知识。如何从这些海量的信息中检索出所需要的

【作者】

：

于春雷

【机构】

：

重庆大学

【出处】

：

重庆大学

【发表日期】

：

2011年期

【关键词】

：

搜索引擎个性化服务信息检索用户兴趣挖掘层次加权关键词矢量模型查询扩展技术

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术的迅速发展，Internet为人们提供了极其丰富的信息资源，在这些海量、异构的Web信息资源中蕴含着具有巨大潜在价值的知识。如何从这些海量的信息中检索出所需要的信息已成为一个非常重要的研究课题。搜索引擎成为人们快速获得信息的首选工具，在一定程度上可以满足用户信息需求。但是，搜索引擎上大多数的查询是短小且意义不明确的,即使同样的查询对于不同时期、不同背景、不同领域的用户，他们搜索意图是不同的。目前，现有的大多数搜索引擎都不能充分、有效地利用用户自身的浏览信息，基本上都采用“一个搜索适用所有用户”的搜索模式，不具有识别用户兴趣、偏好的能力，以至于不同的用户只要在同一个搜索引擎上使用同一关键词查询，所得到的查询结果都是一样的，这显然不能满足各种用户的需求。同时，查询返回的结果往往数以万计，内容良莠不齐，使得用户在寻找自己真正需要的信息时犹如大海捞针。个性化搜索引擎针对不同用户，提供个性化服务，已成为信息检索领域的研究热点之一。本文有针对性地重点展开基于用户兴趣挖掘的搜索引擎个性化研究，通过为大型Web搜索引擎增添个性化插件的方式来满足用户对搜索引擎个性化服务的需要。　　本文研究的内容主要包括以下几个方面：　　1基于用户兴趣挖掘的用户兴趣模型的构建：通过分析用户兴趣的来源，提出用户兴趣建模工作将基于用户浏览的兴趣网页而非浏览的所有网页，自动过滤掉无关的噪声网页；从自动获取的用户浏览过的兴趣网页及其浏览行为等兴趣信息中归纳构建出可计算的层次加权关键词矢量模型来表示用户兴趣类别偏好，提出了改进的类兴趣度权值度量方法。　　2基于用户兴趣模型的个性化查询扩展：结合用户兴趣模型中各个兴趣点的类兴趣度权值和文本描述信息，本文介绍了用户初始查询到最相关兴趣类的映射方法；在余弦相似度方法基础上，通过引入用户历史查询词词典技术，本文提出了一种基于用户历史兴趣网页和历史查询词相结合的个性化查询扩展算法。当用户在搜索引擎上输入查询词时，算法能根据学习到的当前用户兴趣模型动态判定用户潜在兴趣和计算词间相关度，并将恰当的扩展查询词组提交给搜索引擎，从而实现不同用户输入同一查询词能返回不同检索结果的目的。　　最后，设计开发了验证本文研究内容的个性化查询扩展插件系统PSE，并结合Google和百度分别做了个性化查询扩展对比实验，通过试验证明了本文工作的可行性和有效性。实验结果表明，本文提出的方法既利用了当前主流Web搜索引擎在响应速度和查全率上的优势又弥补了其在个性化和查准率方面的不足，在信息检索领域具有一定的学术参考和应用价值。

其他文献

内科杂病验案4则

本文记录了许正锦副主任医师临床治疗内科杂病验案4则,分别为尿少案、结石案、奔豚案、多汗案,其中许主任采用五苓散加减治疗尿少,三金排石汤化裁治疗结石引起的尿血,采用桂

期刊

尿少结石奔豚医案旴江医学许正锦

基于环境地图的多移动机器人协同机制研究

多移动机器人相较于传统的单移动机器人,在执行任务能力以及功能鲁棒性上面都有很大的提高。由于机器人研究平台的复杂性和异构性,现有的多移动机器人研究都是基于外部传感器

学位

全环境因素多移动机器人协同机制ROS平台

呼吸与肺部肿瘤位移关系的研究

在放疗过程中,患者的呼吸运动对精确放疗产生了影响。针对这些影响,目前主要的解决方法是扩大计划靶区,但这会使患者的正常组织接受更多的射线。四维图像引导放疗在三维放疗

学位

肿瘤运动四维计算机断层扫描图像模板匹配三维光流法

煤质数据挖掘与综合信息管理系统开发

论文针对煤炭企业在销售中所面临的问题和挑战开展研究,基于数据挖掘和数据访问等相关理论,对平顶山天安煤业股份有限公司一段时期内煤炭密度测量数据进行了深入分析和研究,

学位

回归分析数据挖掘ADO.NETEntityFramework

二值图像水印技术及其在密级标识中的应用研究

密级标识添加与管理是实现多级安全和等级保护的基础,虽然我国在相关保密制度上已经有了明确规定,但是目前尚无可靠的技术手段保证国家政策的有效实施,这已经成为电子文件保

学位

密级标识二值图像水印小波变换纠错码中国剩余定理

基于协议分析技术的异常检测算法的设计

随着人们对互联网的需求日益增大，网络安全已经逐渐成为了网络各项服务与应用进一步发展急需解决的关键问题之一。入侵检测作为一种积极主动的网络防御安全技术，在网络安全技术

学位

网络安全协议分析入侵检测异常检测隐马尔可夫链

将公益进行到底

“赠人玫瑰,手留余香。”12岁的王纪涵立志将公益进行到底。这个乐观、开朗、积极向上的男孩,把做公益当成自己最快乐的事。王纪涵读三年级时,一次偶然的机会,他和爸爸到黄骅

期刊

电影频道节目新闻宣传部国家广电总局文艺晚会北京紫禁城影业公司电影局抗震救灾奥林匹克邓超

2014年1月钢坯分国别(地区)出口情况

请下载后查看，本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.

期刊

钢坯累计金额同比台湾省同期

结合深度数据和AdaBoost的人脸检测算法研究

人脸检测是计算机视觉领域的研究热点之一,当前的人脸检测研究主要使用二维彩色图像,但二维图像具有由于光照条件变化而导致信息缺失的固有缺陷,从而影响到人脸检测算法的性

学位

人脸检测深度数据轮廓匹配

协同设计资源的不确定优化调度研究及实现

协同设计是一种基于网络的群体工作环境,设计人员在这种环境中相互协调、相互共享信息资源,快速高效地共同完成产品设计任务。相比传统的以个人设计为主的工作模式,协同设计

学位

协同设计资源不确定调度自由搜索算法本体多Agent系统区间数表示

基于用户兴趣挖掘的搜索引擎个性化研究

与本文相关的学术论文