面向个性化信息检索的用户兴趣建模研究与实现

被引量 : 0次 | 上传用户:nomaryo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网资源爆炸式增长,导致“信息过载、资源迷向”,给信息检索领域带来巨大的挑战。传统的信息检索被动的接受用户的请求,无法主动感知用户的信息需求。仅仅依靠传统的信息检索已很难满足用户信息需求复杂化和差异化的趋势。所以,考虑用户信息需求差异性的个性化信息检索越来越受到用户的青睐。本文主要研究个性化信息检索的基础和核心——用户兴趣建模。本文的主要工作如下:1.针对向量空间模型表示用户兴趣,在准确性和全面性上存在的问题,而且不考虑用户兴趣的多样性,提出了基于层次性向量空间模型来表示用户的兴趣。实验表明,该种方法可以比较准确、全面的表示用户的兴趣。2.在分析了基于网页驻留时间和浏览次数计算网页兴趣度的算法的基础上,针对这种算法没有考虑网页的大小,提出基于浏览速度计算网页兴趣度的算法。设计实验并比对实验数据,结果表明基于浏览速度计算网页的兴趣度更接近真实值。3.针对用户兴趣模型层次性及扩展性的要求,采用XML存储用户兴趣,并使用倒排索引技术建立“用户—XML”的映射关系,可快速根据用户名找到相应的兴趣文件,提高个性化信息检索的检索速度。4.提出一种改进的用户兴趣建模方案,并且,设计和实现了用户兴趣建模,并将建立的用户兴趣模型应用于Nutch搜索引擎,从而实现个性化的搜索。最后,通过实验验证,个性化搜索与常规的搜索相比具有更高的查准率。
其他文献
“以人为本”是一种适应未来管理发展趋势的科学理念,“以人为本”应用在高中班主任班级管理工作中,便是“以生为本”。笔者结合五年的班主任班级管理经验,基于“以生为本”
本文以《反思与重构——佩里·安德森的历史唯物主义“图绘”》为主题,对安德森的历史唯物主义思想进行系统阐发和剖析。首先,由资本主义过渡到社会主义的策略始终是安德森的
魏晋南北朝是我国多民族发展的重要时期,北朝是这一时期民族发展的分水岭。北朝承魏晋十六国以来民族大动荡,民族间通过各种方式的迁徙,促进了民族间的融合。到北朝结束时,我
2005年中国宣布人民币汇率制度改革以来汇率水平开始大幅升值,升值带来的影响深入我国经济体的方方面面,引起了国内广泛的关注。目前国内学术界大量的研究从总量的角度来分析
<正>傍晚时分,校园附近被称作"堕落街"的小街迎来了它一天里最热闹的时候。原本就不太宽敞的街道被小餐馆摆出的餐桌占去了一半,剩下的一半则被来来往往的人流占据,而司语正
期刊
在婚姻情爱的众多禽鸟象征中,凤凰颇具特色。凤凰在婚姻情爱中的表现形式,其一为象征情侣或配偶,如:"凤凰配"、"双凤配"、"鸾凤配"、"龙凤配"等;其二为情感的寄托物。凤凰的"
今日的中国诗,似乎已经走入无法挽救的消亡之路,同时中国歌词正越来越繁荣。这个强烈对比,使理论界和诗歌界不得不面对一个问题:中国诗能否从歌词获得重生机会?本文回顾了中
<正> 这篇文章为数力系一二年級同学而写,可作为学习高等代数課的参考材料,还可作为初中数学教师参考。第一部分証明了关于自然数集的三个等价命題。因之导出結論:如果其中一
腰腿软开度是对舞蹈演员的一种特有的要求,这一点对于最初从事舞蹈表演艺术的学员来说,未必是自觉的。 随着年龄的增长,肌肉韧带纤维失去弹性,关节逐渐僵化,不能适应舞蹈专业的需