基于用户行为的电影推荐系统的设计与实现

来源 :安徽理工大学 | 被引量 : 3次 | 上传用户:zjj1993930
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速发展,越来越多的网民习惯性地从网络中获取需要的数据来解决生活中的众多问题,但是网络上混杂的海量数据给人们筛选出自己想要的数据造成了巨大的困难。为了解决这一矛盾,个性化推荐技术应运而生。推荐算法作为个性化推荐系统的核心一直是被关注和研究的重点。在众多的推荐算法中,应用最为广泛的就是协同过滤算法。传统的协同过滤算法使用网民对项目评分作为算法的输入,忽略了用户行为(比如购买、收藏、转发、项目点击次数)对于项目评分的影响,进而造成项目评分不够准确、用户-项目评分矩阵过于稀疏,最终导致推荐效果精准度较低。为了提高个性化推荐技术的效率,本文提出了一种基于用户行为的聚类推荐算法,并且在该算法的基础上,实现了一个基于B/S架构的个性化电影推荐系统。该算法从两个方面进行了改进:一是综合考虑用户行为信息和项目类别偏好信息。首先通过实现豆瓣电影为开发人员提供的第三方接口获取到用户的web日志,进而提取到用户的行为信息。根据经验对不同的用户行为赋予不同的线性权重,将用户行为转换成对项目的评分用以填充稀疏的用户-项目评分矩阵。填充后的用户-项目评分矩阵在数据稀疏性上较之前有了一定程度的下降。其次根据填充后的用户-项目评分矩阵按照项目类别进行k-means聚类,产生多个聚类簇。计算目标用户与聚类簇的距离,将目标用户归入距离最近的簇类中。最后在目标用户所属类簇中,使用传统的基于用户的协同过滤算法为目标用户生成个性化推荐列表。二是考虑到传统得余弦相似度计算对于距离不敏感的问题,本文提出了一种融合评分差异度权重的计算方法。在计算目标用户所属聚类的最近邻时,提高了最近邻计算的准确性,最终提高了推荐的精确度。本文采用了豆瓣电影系统为第三方开发人员提供的接口获取相关的用户行为数据,采用了综合F1综合指标和准确率来衡量推荐算法的质量,通过对比传统的基于用户的协同过滤算法(CF),基于用户聚类的推荐算法(UCCF),证明本文提出的基于用户行为的聚类推荐算法(ABUCCF)的有效性。
其他文献
明代是回族发展壮大的重要时期,也是其民族共同体得以最终形成的关键时期。与唐宋元相比,明代对少数民族实施了相对收紧的政策,禁胡服胡语,禁止本类自相嫁娶,这在客观上促使
提出了一种片上集成的低功耗无电容型LDO(low drop out)电路。该电路采用折叠型cascode运放作为误差放大器,通过消除零点的密勒补偿技术提高了环路稳定性;并在电路中加入了一
去年以来,柳江县严格按照“生产发展、生活宽裕、乡风文明、村容整洁,管理民主”的要求,坚持“政府引导、农民自筹、社会力量参与”的原则,在资金筹措上采取“几个一点”(即政府帮
美国拥有世界上最为庞大的高素质人才队伍,科技上也一直处于领先优势,这与其建立起充满生机和活力的人才机制是密不可分的.美国的人才机制主要包括三个方面:
战区作战保障指挥能力建设,是作战保障建设的重要组成部分,制约着战区联合作战能力的提升。要完善指挥信息系统,加强作战保障指挥训练,健全作战保障法规制度,完善作战保障指
江苏省昆山市有一个公司,专门生产电脑上网用的连接线之类的小配件,产品销往国内外,占领了全世界同类产品市场的80%.它启示人们:"市"无巨细,只要精于此道,做小产品一样能取得
针对钢管制管过程中钢材板卷反复弯曲展平对钢材强度的影响,对X80钢制成的试样进行了4点弯曲实验.在各弯曲试样得到不同的预应变后,又对其进行反向加载,记录不同预应变下各试样反
追求名牌是一种普遍的消费心理,消费者选择名牌一方面是希望得到品质的保证,降低购买风险,另一方面也为了达到某种消费心理的满足。究竟何为“名牌”?名牌是在市场上受消费者认可