论文部分内容阅读
随着互联网和信息技术的发展,人们已经进入大数据时代,获取信息的方式越来越多,信息资源也爆炸式地增长着。在享受着信息时代带来的种种便利的同时,人们也面临着信息爆炸式增长带来的种种挑战。个性化推荐系统的出现有效缓解了信息过载问题,作为一种高效的信息过滤手段,广泛应用于各大门户网站以及电子商务领域。推荐算法作为个性化推荐系统的核心内容,一直是学术界和电商行业研究的热点。在诸多推荐算法中,协同过滤算法不需要分析项目内容,能够对概念复杂的项目作推荐,而且推荐结果更具个性化,是目前应用最为广泛的推荐算法。但是面对数据稀疏性、相似度度量、冷启动等问题,协同过滤算法依旧有许多需要改进的地方。通过对基于用户协同过滤算法和基于项目协同过滤算法的系统研究,本文提出了新的加权协同过滤算法,致力于缓解数据稀疏性和相似度度量问题,提高协同过滤算法的推荐精准度。首先,新的算法对相似度计算方式进行改进,分别将用户之间和项目之间的共同评分项数量引入到用户相似度和项目相似度的计算中,对相似度大小重新度量,使相似度顺序更符合实际情况。其次,引入相似度质量这一概念,在新的混合协同过滤算法中,用户近邻集合的相似度质量决定了基于用户协同过滤算法的权重,项目近邻集合的相似度质量决定了基于项目协同过滤算法的权重。同时为了减缓数据稀疏性带来的影响,在权重因子中引入控制因子来优化推荐效果。然后,设计实验对新算法的可行性和算法质量进行检验。实验确定了控制因子最优值的存在,并通过控制因子有效降低了数据稀疏性对推荐质量的影响;之后将新算法与其它三种协同过滤算法进行对比,进一步验证了该算法有效提高了预测精准度和推荐质量。最后,基于本文提出的加权混合协同过滤算法设计出一个电影推荐系统,采用B/S结构,从表现层,业务层和数据层三个方面进行架构,实现电影的个性化推荐功能。