基于主题模型的自适应混合推荐算法的研究

来源 :浙江大学 | 被引量 : 0次 | 上传用户:aig2008
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
我们生活在一个信息过载的时代,网络技术的迅速普及和各种应用的丰富发展,使人们越来越多的使用互联网的服务,在互联网上积累了过于庞大的数据。“信息爆炸”是一个越来越引起人们重视的话题。搜索引擎的出现一定程度上缓解了这个问题,但是关键词检索对用户要求过高以及无法向用户提供个性化的服务,使用户的很多需求得不到满足。推荐技术应运而生,推荐系统发掘用户的兴趣和行为模式,进而向其推荐可能感兴趣的资源。这一方面能向用户推荐最新的或者不热门的物品,大大缓解长尾现象,另一方面也使用户能获取到更加满意的信息。  传统的推荐技术由于只能利用有限的信息往往会遇到数据稀疏和冷启动的问题而使推荐的准确度急剧下降,并且大部分方法不能给出很好的推荐理由。有解释的推荐结果更能够让用户信服,因此也得到了越来越多的重视。这些都是当今推荐系统在实际应用中遇到的问题,也是学术界最热门的研究方向。  针对上述问题,我们提出了基于主题模型的自适应混合推荐算法。具体来说,除了评分信息以外,我们考虑充分利用丰富的文本信息,对这些信息采用主题模型的方法进行建模,能很好的缓解数据稀疏问题,另外由于新物品的主题构建并不需要用户数据,从而缓解冷启动的问题。接着我们将主题模型与传统的协同过滤算法进行结合形成了一个自适应的混合推荐算法。  最后,本文设计了详细的实验来验证我们的算法。实验数据集基于被学术界广泛使用的Amazon数据集和Movielens数据集并做了一些扩充,实验结果充分证明了我们模型的有效性和稳定性。
其他文献
该文研究了智能IP通信网络(Intelligent IP-based Communication NETwork,简称INET)的体系结构和基础结构.在IP通信网络的基础上,该文提出了智能IP通信网络的概念.它是一个以使
在英语从句的识别上,该文使用了两种方法.一种是基于大规模语料库,采用规则来识别从句的左右边界.Penn treebank是一个拥有各层次标注的英语语料库.通过分析语料库中的大量从
该文首先扼要地介绍了虹膜识别系统的组成结构.然后,阐述了虹膜预处理技术及虹膜纹理规范化过程.最后就虹膜识别的关键技术"虹膜纹理编码及匹配"进行了深入的探讨.该文给出了
该文通过对数据挖掘和数据仓库技术的介绍,以及对联机分析挖掘和联机分析处理的结构比较和分析,提出了基于多维立方体的数据挖掘的思想,使数据挖掘能更加专注于知识的发现,有利于
在电子时代,金钱实际上只是另一种信息:存储在电子总账中的借贷信息。今天的支付系统还和上个世纪八十年代的邮件系统一样——依然封闭而没有互联。在互联网通讯和互联网金融
笔者借鉴虚拟仪器的思想,自行设计开发了一种多用途的虚拟数字存储示波器系统,系统的软件部分包括上位机软件和液晶显示屏控制软件.上位机软件利用计算机图形技术在计算机显
近几年来全球范围内网络迅速发展,业务种类不断推陈出新.随着全球经济一体化的发展,电子商务的应用正逐步广泛,各种企业的网络需求日益增长,用户发现很难构造和维护一个能满
该文提出了两种不同的声控Windows应用程序的系统的解决方案.这两种方案采用不同的语音引擎接口和不同的后处理方法.第一种基于API方案的特点是用法简单,但是应用范围比较窄,
本文从知识及知识表示方法角度出发,对以往的计算机考试系统进行了全面的分析和讨论,从中找到这些考试系统的根本缺点,在于这些考试系统是封闭的考试系统,即这些考试系统均使用过
该文研究的重点是以分布式GIS中的QoS问题为出发点,通过对GIS服务质量因素、图层并发控制和空间索引结构等问题的研究,为进一步系统地研究分布式GIS中的QoS问题做铺垫.该文同