论文部分内容阅读
随着Internet的日益普及,电子商务迅速发展。然而,电子商务产生的越来越多的商品信息使得用户越来越难快速地找到自己喜欢的产品。为解决这一难题,推荐系统应运而生,并在电子商务系统中具有良好的发展和应用前景,逐渐成为电子商务IT技术的一个重要研究内容。协同过滤算法是推荐系统中应用最为广泛的算法之一,通过分析用户兴趣,在用户群中找到与指定用户(兴趣)相似的用户,综合这些相似用户对某一信息的评价,形成系统对该指定用户喜好程度预测,从而向用户们推荐商品,方便了用户对商品的查找。 本文通过对协同过滤推荐算法的深入研究,分析了现有研究中仍然存在的问题,重点对协同过滤算法中普遍存在的用户项目矩阵稀疏问题进行了分析,提出了一种基于可信度的协同过滤算法,其主要思想是结合信任的传递属性和时间效应来计算用户的相似度,产生推荐列表,从而在解决数据稀疏性问题的同时,提高算法的推荐精度。 本文的主要研究内容有如下几个方面: (1)本研究提出可信度的概念,并结合信任的属性对可信度进行了定义。以信任的传递属性和时间效应为主给出了可信度两个指标(信任和信用)的计算方法。 (2)由于传统的协同过滤算法没有考虑用户项目评分的时效性,本研究提出利用遗忘函数对用户项目评分进行修正。 (3)为解决用户相似度矩阵的稀疏性问题,提出了用户直接相似度和间接相似度的概念。其中,用户直接相似度的计算依然为传统协同过滤算法的计算方法,用户间接相似度是结合用户间信任的传递来计算。 (4)在得出目标用户的最近邻居之后,论文提出结合最近邻居在系统中的信用值来预测评分。 (5)使用MovieLens数据库,对提出的改进算法进行了实验仿真与测试,并从多个方面与其他算法进行了比较,验证了改进算法的合理性和有效性。