一种基于向量空间模型的个性化搜索引擎的研究与设计

来源 :中国科学院软件研究所 | 被引量 : 0次 | 上传用户:zhubajie527
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
传统的搜索技术满足了人们一定的需要,但由于其通用的性质,仍然不能满足不同背景、不同目的和不同时期的查询请求。个性化服务技术就是针对这个问题而提出的,它为不同用户提供不同的服务,以满足不同的需求,实现针对不同用户进行相应信息筛选的目的。个性化服务技术能够充分提高搜索引擎的服务质量和访问效率,吸引更多的访问者。   个性化搜索引擎是一种通过机器主动学习用户兴趣,并根据用户兴趣帮助用户进行信息筛选的新一代智能化搜索引擎。本文在对第二代搜索引擎分析的基础上,运用“隐式反馈技术”和“向量空间模型”,设计并实现了一个完整的可学习用户兴趣并可动态调整的个性化搜索引擎。本文的主要工作有:   第一,对目前的搜索引擎技术和个性化信息检索技术进行了较为全面深入的探讨和综述。对于目前已经有的和正在探索中的各种个性化信息检索与提取技术进行介绍和分析。   第二,在用户兴趣提取中,采用了基于隐式反馈技术的多级信息提取方法,提取用户点击历史中的信息。在其中采用了提取即时隐式反馈信息的多级信息沉淀的方法,能对用户短期的兴趣信息进行提取,以适应用户短期的异常行为,同时也可以通过这些信息描述用户兴趣的转移。   第三,在文档的相似度比较方面,采用了向量空间模型,并结合了布尔模型的优点进行了维度复杂性计算方面的改进。对于即时的隐式反馈信息,采用了一种挖掘关键词相互关系的算法来进行用户兴趣种类的判别并根据用户行为的上下文信息做出相应评价。   第四,对每一次搜索,记录用户的点击历史并进行相应的分析,评价用户对于搜索结果的满意度,并动态得对搜索结果进行调整。   本文所设计的搜索引擎能获得对于用户具有较高相关度的搜索结果,减少用户的检索负担,使用户能从大量繁杂的信息中迅速提取到对自己有用的信息,对于提高网络信息的利用效率和用户的工作效率具有十分重要的现实意义。  
其他文献
为了进一步推动健身气功·五禽戏在高校的开展,以课内教学与课外活动为抓手,不断优化高校健身气功·五禽戏课程的教学环境,不断改善高校健身气功·五禽戏学练的氛围,是促进高
城市草坪是以草坪、植物为主建植而成。草坪植物原属于地被植物的一部分,是用于铺设草坪的植物总称。它是园林绿化中的重要组成部分,对覆盖城市裸露地面、美化城市、提高城市环
学生学习过程中要学会产生疑问,才会真正促进学生的求知,会不会提出问题,能不能解决问题最关键的是学生是否能够擅长提出质疑,提出的问题有科学性,俗话说的“有水平”.提出有
微服务架构是一种细粒度、面向服务的软件架构,通过采用一套微服务的方式来构建一个应用,具有业务敏捷、松耦合、扩展性强、复杂度可控、按需独立伸缩等优点,已经成为工业界和学
强化学习是一种重要的机器学习方法。当前,在复杂的多智能体环境下,研究如何应用强化学习算法是机器学习中极具挑战性的前沿课题之一,吸引了国内外众多研究人员的兴趣。RoboCup
很长时间里,高中物理教学不能够很好地与学生生活、社会生产密切联系,造成物理学习和生产生活的分离.这样的教学一方面造成学生机械地被动的接受知识,不能够真正地提高学生的
美国犹太裔作家赫尔曼·沃克的战争题材小说是现代文学史上全景式表现二战进程的一部规模宏大的作品.小说真实地再现了从纳粹德国入侵波兰至珍珠港事件爆发这段战火纷飞的历
发现与创造是两个富有活力的动词,与智者终身相伴,她会打开未知世界的一扇窗。艺术的发现与创造,同样是衡量一个艺术家是否优秀的标准。没有情感的美学,没有发现形式,没有精
叶赛宁的一生充满了悲伤:乡村情结之悲,爱情未果之悲,信仰危机之悲,以及因信仰分歧而导致的友情之悲.这些具有悲剧性的经历直接导致了他的诗歌所特有的忧郁乃至悲观的基调,即
十六国时期,各割据政权在民族融合的大背景下纷纷调整统治政策.前秦皇帝苻坚重用汉族文士王猛,在政治、经济、文化、民族关系等方面进行一系列的革新,使前秦的国力日益强大,