基于上下文背景感知的个性化推荐系统

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:xxuhhe
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,推荐系统在帮助商家提升销量方面扮演着越来越重要的角色。现有工作通常仅仅挖掘了数据中的用户个人喜好或时间信息,而忽略了大众情感对用户购买决策的影响,这造成当推荐系统将一件来自历史购买者给出的总体评价为负面的商品推荐给当前的用户时,即使这件商品很符合用户的喜好或者当下非常流行,用户也会倾向于最终拒绝购买它。因此,构建一个既能够捕捉用户个人喜好,又能时序-情感背景感知的用户行为模型显得格外重要。但是,如何以统一的方法从历史数据为当前用户进行推荐是一项具有挑战的任务。另外,由于用户一般只会对少数物品进行评价,这就造成了数据的稀疏性问题,使得为用户建模带来了难处。  为了解决上述问题,本文首先根据真实数据集的分析,提出了有关用户在线行为的几个观察,进而提出了一个时序情感感知的推荐系统-TSARS。首先,为了从交互型数据集中建模用户行为,本文提出了基于概率图模型的TSARS-Ⅰ模型,其能够很好地对用户的点击和收藏等交互行为进行建模,同时本文为TSAUB-Ⅰ设计了一个基于EM的算法对模型参数进行估计。其次,为了从文本型数据中建模用户行为,本文提出了同样基于概率图模型的TSAUB-C模型,它能够对用户的撰写评论行为进行建模。本文为TSAUB-C设计了一个基于Gibbs采样的算法以对模型参数进行估计。这两个模型均融合了时序和情感信息,因此较好地缓解了数据的稀疏问题。之后,TSARS的推荐模块则根据网络平台的特点自动选择TSAUB-Ⅰ或TSAUB-C用户行为模型学习到的知识,根据特定的算法为每件候选物品计算分数,最后为当前的用户查询挑选出分数最高的k个物品,生成推荐列表。用户行为模型的参数较多,因此随着日益增长的数据量,单机运行的模型参数估计算法会变得非常耗时,为了提高推荐效率,本文利用Spark框架将用户建模的训练算法分布式化,从而使TSARS成为一个高效和可扩展的系统。最后,在数个大规模真实数据集上的大量实验结果证实了TSARS确实能够为用户高效且有效地进行推荐,而且其效果超过了当前主流的推荐方法。
其他文献
计算机通信协议的开发难度随着复杂程度的增加而日益增大,潜在错误也越来越多,其中对协议规格说明理解的偏差是重要原因之一.因此需要对协议进行一致性测试,协议的一致性测试
目前,藏汉翻译在藏文化传播上具有十分重要的意义。人工翻译的方式无法满足藏汉翻译的需求,将现有的较为成熟的机器翻译技术应用于藏汉机器翻译十分必要。而集外词的出现,会严重
本文主要分为四个部分。第一部分是引言,主要讨论了在Java中引入泛型特性的原因,并概要介绍了泛型和JSR-14的一些背景知识。第二部分就主要研究了它的语法特性。该部分首先描述
差分隐私模型因其可证的隐私保障和有效实现方式而获得了广泛研究。粗略来说,如果统计查询结果与单个个体的数据的存在与否几乎没什么关系,则该查询满足差分隐私。本论文研究差
本文首先研究了定题搜索Robot中的一些关键技术,包括Robot爬行的原理,Robot的基本组成,机器人排斥协议,以及经典定题搜索算法与网页相关度评价,并提出了定题搜索算法的改进方案。
在军事指控领域中,伴随着硬件规模和复杂度的不断加大,以及苛刻的实时性能需求和各个平台之间实时要求的巨大差异,对于硬件平台之上的实时操作系统要求越来越高.但是当前的实
在本文中对已有两种算法进行研究和分析的基础上,提出了一些新的建议。本文的工作大致可以归纳如下:① 在系统算法中给出一种新的启发策略,并实现了修改后的算法。同时,用部分实
本文完成了一个基于Clark&Wilson模型的信息管理安全子系统(SSBCWM)的设计和实现.这一模型通过密切结合密码保护,触发器结构和改进的物理存储机制增强了数据库管理的安全性能
本课题旨在用π-演算对openMosix的一些基本特征进行解释,选取了进程迁移作为切入点,重点研究在进程迁移的情况下,进程间的互操作关系,用π-演算给予了形式化的描述。本文的主要
本文介绍了构造Java企业级系统的最新平台——J2EE,详细阐述了它的组成、基于J2EE构建企业系统常用的主要技术,包括Servlet、JSP、企业JavaBean和一组常用API;研究了J2EE的在企