个性化检索系统中用户兴趣模型构建研究

来源 :长春工业大学 | 被引量 : 0次 | 上传用户:nmjhurfdv
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着大数据时代的到来,如何管理、利用互联网中已存在的海量数据成为当下的热点。每天用户对于互联网产品的使用都产生大量的历史数据,但一般的搜索引擎并不会利用这些数据,其检索的结果也通常无法满足用户的个性化需求。因此,个性化检索系统已经成为互联网新技术中的一个研究热点。本文首先介绍了查询-概念二分图理论,通过分析其中对查询权重设计不合理的问题,提出以查询为单位划分用户浏览历史。本文利用从用户历史中抽取的概念描述查询,对于查询本文在计算其权重时参考了查询使用的时间、出现的先后次序等因素。用户兴趣建模过程中本文通过聚类算法将相似的查询组合在一起,降低了用户兴趣模型的维度,使得每个查询在模型中的比例更加合理。在模型存储和更新问题上,本文提出自己了的存储格式、更新算法。最后,利用构建的个性化检索原型系统,实现了用户浏览历史的捕捉,通过模拟用户的浏览过程验证了以查询为单位对用户兴趣的描述更合理。在与其他建模算法的对比中证明了本文提出的建模算法能够获得更为优秀的兴趣模型。系统运行的结果体现了本文设计的更行算法也较为合理。
其他文献
频繁项集的挖掘技术在如今的数据“爆炸”时代,有着越来越重要的地位,它是解决实际问题的一种非常重要的手段。很多学者在最近20年中提出了许多有关挖掘频繁项集的相关算法以
随着海量的、面向广域网的存储系统的出现,其内部存储资源的复杂性远远超过传统的存储系统。它拥有更多的存储资源、资源异构性突出,并且资源分布更广泛。因此构建面向广域网
在保证软件产品质量方面,软件测试是一种非常重要的手段,其可以增强软件产品的可靠性,但同时它也非常耗费人力和时间。类簇级测试又称集成测试,它是面向对象软件测试中不可或
流媒体是现今Internet上最为流行的网络应用之一。通过流媒体技术,用户不需要下载完成全部的多媒体信息(包括音频和视频),就可以边接收数据流边播放,这不仅可大大缩减系统对用户
从因特网的“深度”将其分为Deep Web 和 Surface Web两类。Deep Web中蕴含有极其丰富的信息,并且比Surface Web所蕴含的信息更加具有利用价值。然而,由于DeepWeb信息是以相
命题逻辑的可满足性问题(SAT)是计算机科学中的核心问题.最大可满足问题(Max-SAT)是SAT问题的一个自然的扩展.对于给定的CNF公式,Max—SAT问题的目标是找到一个赋值使其满足最多
当代企业正经历着一场剧变:易变的市场、全球化的竞争、快速换代的产品、个性化的客户需求、更加严格的标准。信息技术是企业提高运作效率和效益,获得战略优势的重要手段。投巨
伴随着新一代网络—语义网的蓬勃发展,互联网资源的混乱、重复和冗余等问题得到了很大的改善。作为语义网的核心,本体研究已经有了很大突破,并在许多科研方向得以应用。然而
SAS(Serial Attached SCSI,串行小型计算机系统接口)是一种面向企业级应用的串行磁盘接口,SAS协议综合了并行SCSI和串行连接技术的优势,是一个以串行通讯协议为基础架构的多
随着网络技术和音视频技术的发展,多媒体应用在人们的生活中扮演越来越重要的角色。而视频编解码技术在多媒体应用中尤其重要。AVS作为我国自行制定、拥有自主知识产权的数字