基于查询分类的增量式用户个性化建模技术研究

来源 :浙江大学计算机科学与技术学院 浙江大学 | 被引量 : 0次 | 上传用户:glei66
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web上信息量的增长,搜索引擎成了人们检索信息的重要工具,Google、Baidu等主流的搜索引擎成了网民工作学习中不可或缺的重要工具。但是这些通用搜索引擎不能更加准确地了解用户的需求,不能针对特定的用户给予个性化的服务,因此如何提供一种切实有效的方法,以用户为中心,帮助用户有针对性地获取真正需要的信息,成了研究者们所面临的一个重要课题,因而个性化搜索技术逐渐兴起。用户兴趣模型是个性化搜索的关键技术之一,是一个能为用户提供个性化信息服务的信息检索系统的核心组成部分。本文对当前主要的用户兴趣模型进行了研究,提出了一种基于挖掘用户查询日志建立的增量式更新的用户兴趣模型。本文的工作主要包括以下三个方面:(1)基于伪相关反馈技术,利用搜索引擎的搜索结果对查询日志进行查询扩展,结合文本特征提取、文本分类等技术建立查询分类模型。(2)在查询分类的基础上,提出一种基于向量表示的用户兴趣模型,表示用户对各个分类领域的兴趣程度。(3)对比平均加权算法、时间窗算法,引入遗忘因子,提出一种符合人的遗忘规律的增量式的用户兴趣模型更新算法。本文还通过实验系统的设计和实验数据的分析,对其中关键的查询分类准确率和用户兴趣模型的稳定性和及时性进行评估,并在本文的最后提出进一步的研究方向。
其他文献
近年来,随着互联网的快速发展,随时随刻产生着不计其数的信息。在数据挖掘、机器学习、信息检索等领域,如何从庞大的信息中,挖掘有用的信息显得尤为重要。这些信息包含多种数
随着人们对视频质量的要求逐渐提高,传统的H.264/MPEG-4 AVC视频编码标准的缺陷日益凸显。为了应对更大的分辨率和更加清晰的视频的编解码和传输问题,视频编码联合专家组提出
分布式交互仿真是当今计算机仿真领域的前沿课题之一,在国民经济和国防建设领域都有着广泛的应用。本文以消防模拟演练为背景,详细阐述了在HLA(High LevelArchitecture,高级体系
目前人工神经网络、遗传算法是计算智能这门交叉学科的基本内容。针对BP神经网络的不足,将遗传算法和BP神经网络两者有机的融合在一起,可以充分利用遗传算法的全局搜索能力和
随着网络技术的发展进步,网络学习或远程学习的人数日渐上升,如今各高校都掀起制作网络课程、精品课程的热潮。研究者发现,随着网络学习资源的数目增多,资源的质量以及符合学
能否获取及时、准确、完整和可靠的战略、战役和战术等军事情报,占领军事情报信息高地,关系到战争的走向,是取得战争胜利的关键。现代高科技海战中,获取军事情报的重要手段是
网格是近年兴起的一种重要的并行分布式计算技术,其关键技术之一是对网格中的资源进行管理。一种好的资源管理技术能够充分有效的利用网格上的资源,以吸引更多的资源拥有者将
随着信息和多媒体技术的飞速发展,多媒体信息给人们的生活创造了极大地便利,但同时也暴露出越来越多的安全隐患问题。信息隐藏技术作为信息安全技术研究领域中的一个新兴方向
工程地质研究是我国铁路建设的重点研究工作。随着计算机软硬件技术的发展,计算机已经发展成为各行业获取和管理信息的主要工具和手段。地质研究是我国工程建设的重要基础研
煤炭是我国重要的基础资源,煤炭物流在我国流通领域占据着重要位置。山西煤炭运销集团有限公司拥有丰富的煤炭资源和基础网络资源,完备的公路煤炭运销体系,构建虚拟交易平台