论文部分内容阅读
近年来,信息技术的飞速发展和互联网络的普及,推动了电子商务的发展。这在方便用户生活和生产的同时,也带来数据过载的问题。推荐系统正是解决这一问题的有效途径,它可以模拟销售人员帮助用户进行购买,减少用户搜索商品的时间;同时也可以帮助电子商务提供商快速发现自己的潜在客户,提高利润。因此,推荐系统成为国内外学者研究的热点问题。推荐系统基于用户的历史行为推测用户的兴趣模型,进而从海量信息库中筛选合适的对象推荐给用户。推荐算法是推荐系统的核心部分。推荐算法大体上可分为基于内容的推荐算法、协同过滤推荐算法、基于网络结构的推荐算法以及由不同推荐算法组合而成的混合推荐算法等。其中,协同过滤算法是主流的推荐算法之一,已被广泛应用于一些商业推荐系统。而基于评分的协同过滤算法备受关注,研究者对基于评分的协同过滤算法进行了深入的研究,取得了可喜的进展。但因数据的稀疏性、冷启动等问题,推荐算法的准确性仍有待改进。因用户及项目的相似度度量是影响推荐质量的主要因素,因此寻找利用其他辅助信息(如:标签信息的利用)来改进相似度度量成了研究者的主要任务之一。为此,本文侧重针对评分数据,围绕用户及项目的相似度度量策略设计、如何有效利用标签信息这两个方面展开研究。论文的主要工作如下:1.提出结合标签和评分的协同过滤推荐算法(UTR-CF).该算法结合标签信息和评分数据设计了一种新的用户及项目的相似度度量策略,克服了仅利用评分数据进行相似度度量的不足。在MovieLens数据集上的实验结果表明,UTR-CF算法可有效提高推荐的准确性,克服数据的稀疏性问题。2.提出嵌入LDA主题模型的协同过滤推荐算法(ULR-CF)。该算法在文档-标签分布上利用LDA主题模型挖掘潜在主题信息,从而获得文档-主题分布,进而基于文档-主题分布与评分数据设计了一种新的相似度度量策略。在MovieLens数据集上的实验结果表明,ULR-CF算法可有效克服数据的稀疏性问题,有效提高推荐系统的推荐准确性。3.提出嵌入局部相似性的矩阵分解算法(ELS-MF)。该算法通过在最小化平方误差函数上嵌入局部相似性约束条件对已有矩阵分解算法进行改进,从而得到隐空间中更加精确的隐变量,获得更准确的推荐结果。在MovieLens数据集上的实验结果表明,ELS-MF算法可有效降低推荐系统的预测误差。