论文部分内容阅读
随着网络日益普及和使用电子商务平台进行购物的用户越来越多,电商的商品种类和信息也越来越庞大,海量的商品和平台信息往往消耗掉网购用户大量的时间和精力进行查找商品或检索相关信息。对于电商,也会因为其不良用户体验而导致客户量的减少。为了减小在海量信息面前用户的负担,使得信息被更加高效的发掘和利用,个性化推荐系统的概念被提出、研究、实践和发展,当前已被开发出多种推荐算法,并使用在不同的场合下来帮助电子商务网站为顾客提供个性化的信息服务和决策支持。另外,推荐系统也广泛的被应用到其他各类信息及社交平台,为用户动态地推荐其所感兴趣的对象,例如电影、书籍等,甚至可以进行跨领域的推荐,从而可以广泛并深入的挖掘用户的兴趣点及喜好,使得用户对相应信息平台的使用更加充分,同时也增加了用户对系统的忠诚度。本文首先从宏观上对推荐系统的含义、构造、作用进行介绍,针对核心的推荐算法进行研究、改进,从准确率上对算法的优化结果进行验证。协同过滤是当前被广泛应用的一种推荐算法,它具有较好推荐的准确性、多样性及拓展性。协同过滤包含以模型为基础的协同过滤和以内存为基础的协同过滤两大类算法,其中,基于内存的算法又包括基于项目与基于用户两种。但它们存在共有的缺点是数据稀疏,难以处理大数据量影响即时结果,因此发展出基于模型的协同过滤算法。该算法是先通过历史数据学习得到预测模型,再利用该模型进行预测。虽然协同过滤作算法在当前电子商务中应用广泛,协同过滤算法仍然存在着一些缺陷,其主要的缺点有:推荐的准确度问题、可扩展性问题、实时性问题、冷启动问题。为了克服协同过滤算法中存在的弊病,本文提出了一个基于学习分类预测模型的统一模型(结合潜在属性的协同过滤模型),它统一了用户和项目的外部属性和潜在属性来提供更加准确的推荐服务。将协同过滤推荐问题映射到文本分析处理问题,利用概率潜在语义分析PLSA来分析用户历史评分数据,并计算用户和项目的潜在属性。该方法分两个步骤:第一步,使用历史评分数据来计算获取用户和项目的潜在属性;第二步,使用传统的近似函数学习模型(例如人工神经网络)在潜在属性空间中来建立评分函数。相比标准的基于内存的推荐方法,该方法的主要优势在于更高的推荐准确度,预测时间为常量级别,以及更清晰和简洁的模型表现。实验评估结果表面了该模型比以往推荐方法的具有较大的提高。