论文部分内容阅读
随着互联网的迅猛发展,网络上与商品信息相关的数据量急剧增长,商品发展呈现多样化、品种多、类目繁杂等特点,互联网开始进入大数据时代,而由于“信息过载”问题的存在,用户无法快速、准确地定位到自己感兴趣的产品。在此背景下,个性化推荐系统应运而生,它通过获取用户个性化的需求和特征,在合适的场景给用户推送合适的服务,引导用户便捷地寻找到所需的信息,从而很好地解决“信息过载”的问题。个性化推荐技术广泛应用在电子商务、广告投放、移动平台等领域上,其中在诸多实现推荐的算法中,协同过滤的推荐算法得到的研究最多、应用最为广泛。但考虑到该算法面临的数据稀疏问题,以及其仅仅关注用户发表对商品的评分,忽略了用户发布的具有高价值的商品评论信息,本文提出一种融合用户评论的协同过滤推荐算法,在传统的评分数据上融合用户评论文本信息,通过应用LDA(Latent Dirichlet Allocation)主题模型及Rocchio算法挖掘用户发表的评论文本信息,并考虑到用户对显著主题的关注差异,实现对用户偏好建模,在此基础上提出相似度融合和评分融合两种融合策略以及静态加权和动态加权两种加权策略实现评论文本和评分数据的结合,得到最终的综合推荐结果。由于在对用户评论文本进行建模时使用的是用户所有评论文本,不再是仅仅利用共同评分项目的数据,因而能够极大地缓和了评分数据稀疏的问题,同时将传统协同过滤和用户文本主题偏好信息相结合可计算得到更为精准的用户近邻,为用户产生更准确的推荐。最后,针对本文提出的融合算法,选取公开中、英文数据集及相应效果评估指标,设计对比实验验证融合算法的有效性。实验结果表明:本文提出的融合算法能显著提高传统协同过滤算法的推荐效果,并且在提升效果上相似度融合策略比评分融合策略优秀,动态加权策略比静态加权策略更能显著地提高推荐效果,同时抽取显著的LDA主题再进行加权融合的思路可进一步提高推荐效果。