论文部分内容阅读
搜索引擎在越来越多的海量的信息资源中的检索,没有考虑用户的个性化需求,而是查询某一关键词时,返回的结果往往都是一致的,不能为每个用户返回其所需的特定信息。
个性化推荐是解决该问题的有效途径。当前主要的个性化推荐算法如基于内容、基于协同过滤的推荐算法以及两种算法的结合体这三类推荐算法,虽然可以满足用户的个性化需要,但仍还存在很多函待解决的问题。这些问题包括:新用户、新项目问题,数据的稀疏性问题,算法的可扩展问题,用户隐私与安全问题,孤立点用户问题等问题。
本文实现了一种基于二分图上资源扩散原理的推荐算法。并通过分析该推荐算法所存在的问题,并给出了针对该算法提出基于该算的两点改进。首先改进算法使算法抑制热门电影的推荐度,使冷门电影也能被推荐。其次改进算法使算法削弱电影间多级关联关系对推荐度计算的影响。本文的主要工作包括以下三个方面:
(1)本文分析得出在推荐系统中推荐冷门电影比推荐热门电影,更能提升系统推荐的精确度。对此本文改进了原二分图推荐算法,使算法可以抑制热门电影的推荐度,使更多冷门的电影被用户选择,从而提升了推荐的精确度。
(2)本文还分析得出在电影数据中有大量高阶关联关系的存在,这些高阶关联会使推荐度计算产生较大误差,进而影响系统推荐的精确度。本文提出一种策略可以减小这些高阶关联关系的影响,最终可以提升推荐的精度。
(3)从大量的电影中为每一个用户计算出其最喜欢的K部电影的计算量较大,本为提出采用最小堆算法来计算用户未选择电影中的前K部推荐度最高的电影。该算法的性能表现优于排序算法以及选择算法。
最终应用以上提出的处理策略设计并实现一个电影推荐系统,其运行的效果表明文中给出的策略有效可行,较好地解决了推荐系统中存在的数据稀疏、冷启动以及可扩展性问题,同时算法的推荐精度也较原算法有所提高。