论文部分内容阅读
在电子商务(E—Commerce)领域,个性化(Personalizatoin)服务技术和推荐系统(RecommenderSystem)的应用已经越来越广泛。电子商务站点通过推荐系统向在线顾客推荐诸如书籍、音乐CD、电影DVD、机票和旅店预定等等的产品或者服务。推荐系统通过对顾客购买兴趣和口味的分析和学习,使顾客在在线购物的过程中获得了更加个性化的服务信息,并且辅助它们更准确地购买到自己感兴趣的产品或者服务。与此同时,电子商务站点也因为使用了推荐系统而获得显著的销售量的提高与丰厚的利润上的回报,另外还增进了和客户之间的信任感与良好关系。可以说,一个成熟有效的推荐系统是实现满足顾客购物需求和提高电子商务站点利益双赢的必备条件。
协同过滤(Collaborative Filtering)技术是在过去10年中发展起来的一种主要的推荐技术,很多主流的电子商务站点,如Amazon.com,MovieFinder.com等网站上都能够看到这种技术的痕迹。而现在的推荐系统已经不仅仅依赖与单一推荐技术的应用了,混合型推荐系统(Hybrid RecommenderSystem)也已经越来越多地获得学术界和商业应用领域的青睐。但是无数的(传统的)电子商务站点都仍然保存着大量的已注册用户的人口统计学数据,如性别、年龄、住址、收入和职业等等。如何能够充分利用这些已知的用户信息并且把它们和最新的协同过滤技术有效地结合起来是一个学术界还没有深度讨论的研究方向。本文提出一种在MySQL数据库上用PHP开发,基于协同过滤推荐技术和用户人口统计学数据(Demographic Data)的混合型推荐系统的设计构架;并且给出其具体的设计构建和实现方法。同时,在收集完整的实验测试数据的基础上,本文还探讨了相对于单纯的协同过滤推荐技术而言,结合人口统计学数据和协同过滤技术的混合型推荐系统的先进性和不足之处,并提出了今后的研究发展的方向。
本文的主要成果体现在以下3个方面:
1. 提出把协同过滤技术和人口统计学数据结合起来的方法来实现两者的优势互补:即通过人口统计学数据来提高协同过滤技术的推荐准确度;同时也能解决单纯使用协同过滤技术通常会面临的“冷启动”以及评分或者购买记录数据的“稀疏性”问题。
2. 在以收集自真实用户评分记录的MovieLens数据库的基础上,我们在充分探索和遵循“白箱”设计思想的前提下构建和实现了混合推荐系统原型,并加入了有效的解释界面来增加系统的透明性以及用户对推荐信息的接受程度。
3. 通过在MovieLens数据库上实验结果,我们证明结合人口统计学数据和协同过滤技术的混合型推荐系统在推荐精度上和推荐质量上都相对于单一的协同过滤推荐技术在一定的条件下有了一定的提高,同时有效地解决和减轻了“冷启动”以及“稀疏性”的问题。同时我们还证明在多种人口统计学数据中,年龄因素在辅助基于评分的协同过滤时有着较为显著的效果。