论文部分内容阅读
随着网络资源的不断增加和视频网站的快速发展,传统的信息检索的服务方式已经很难满足用户的需求。所以,个性化推荐服务受到了广泛的关注,它可以挖掘用户信息、电影项目信息、用户的操作日志以及数据间隐藏的关联性,将获得的用户可能感兴趣的影视片推荐给用户。本文对数据挖掘技术和经典的关联规则挖掘算法(Apriori算法、FP—Growth算法),进行了一定的研究和分析,针对Apriori算法在挖掘过程中存在的问题,如生成频繁项目集时需要多次扫描数据库,中间会产生大量的候选集,影响了算法的运行效率等,进行了相应的改进—文中称之为fpmdf算法。Fpmdf算法的基本思想是利用动态函数进行频繁模式挖掘,它是根据事务数据库的事务ID进行配对从而产生候选集,每一次迭代都是在上一次迭代产生的候选集基础上进行,因而无需重复扫描事务数据库,减少了算法的运行时间,并通过实验验证了算法在时间上和空间上的优势。此外,通过比较Apriori、FP-Growth和Apriori改进算法的运行效率,利用己有的实验数据集进行实验分析,验证了算法的可行性。本文最后利用该关联规则挖掘改进算法,设计并实现一个“个性化电影推荐系统”。个性化的电影推荐系统一般包括热门影片的推荐,新片推荐,相关影片推荐等。本文重点讨论如何从大量的历史观看数据中进行数据挖掘,找出不同用户与电影之间的关联以及电影-电影之间的关联,提炼出规则并作为电影推荐系统提供主动推荐服务的参考,从而为用户进行相关电影的个性化推荐,并且对推荐系统进行了满意度测试实验。