论文部分内容阅读
协同过滤推荐是应用最为成功的推荐系统之一,已经被许多电子商务公司所采用。协同过滤的基本原理是应用最近K邻居方法,根据用户评分找出与目标用户最近邻的K个用户。这最近邻的K个邻居用户的评分被用来为目标用户做出推荐。由于协同过滤推荐系统的用户参与性,其很容易受到恶意用户的攻击。用户概貌注入攻击是指恶意用户通过向系统中注入伪造的用户概貌,以使推荐系统产生错误的推荐。恶意用户通过操纵推荐系统获取利益。如何确保推荐系统推荐的安全性已经成为一个亟待解决的问题。本文针对有监督学习的检测方法进行深入研究,主要在以下四点做出创新:(一)基于有监督学习的检测方法将检测属性用作特征构建的方法。本文中,四个新的检测属性被提出:评分间隔均值(MTI)、加权用户评分分布(WURD)、用户相似度分布中心(USDC)以及用户共同评价数偏离度(CRD)。与此同时,一种改进的加权最近N邻居用户相似度(_DegSim’)检测属性也被提出。实验结果表明,使用了本文提出的五种检测属性的检测系统具有更好的检测准确率。(二)填充规模是指用户概貌中评分项目数与总项目数的比例;选择填充比是指选择项目集与填充项目集中项目个数的比例。本文通过实验分析以上两个因子对基于不同分类器的检测系统的影响。实验结果表明低填充规模的攻击用户概貌较高填充规模的攻击用户概貌更难被检测;选择填充比对检测系统没有明显的影响。(三)局部泛化误差模型(L-GEM)用来衡量一个分类器的泛化能力,基于L-GEM构建的分类器具有更好的泛化能力。本文将L-GEM应用到攻击检测中,实验表明基于L-GEM构建的分类器具有更高的检测准确率。(四)本文将协同过滤系统用户概貌注入攻击检测放在对抗学习环境下进行研究。在对抗学习中,对手通过伪装恶意样本来欺骗分类器。对抗学习的一个重要目标是建立鲁棒性更高的分类器,即当对手增大攻击强度时,分类器只有较小的性能改变。本文将模拟对抗环境下的用户概貌注入攻击,实验分析基于L-GEM构建分类器的鲁棒性。