论文部分内容阅读
协同过滤推荐系统在信息检索领域具有广阔的应用前景。它能为终端用户提供个性化的信息服务,有效缓解了信息过载问题。然而,托攻击的存在严重威胁着推荐系统的安全性。恶意用户通过向推荐系统注入刻意伪造的用户概貌,使系统产生虚假的推荐信息,从而牟取非正当收益。若不妥善应对,推荐系统管理者与使用者的利益都将遭受侵害。推荐系统托攻击防御技术近年来引起了学界的广泛关注,并已成为当前推荐系统领域的研究热点之一。作为托攻击防御技术的两个研究分支,托攻击探测技术与鲁棒推荐技术从各自不同的角度探究抑制托攻击负面影响,保障推荐系统安全性的方法。本文在这两方面展开了深入研究,提出了一些有效的解决方案。主要研究成果如下:托攻击探测技术重点关注如何从推荐系统中准确识别出攻击者,从而将这些攻击者从系统中滤除。在此方面,本文以探测技术的实用价值为指导原则,致力于提高探测技术的无监督性与普适性。主要工作包括:–针对现有托攻击探测技术无监督程度较低的局限,本文以攻击概貌的群体效应作为切入点,构建了攻击概貌群体效应的定量度量和相应的遗传优化目标函数,并证明了此目标函数的极大值在理想状态下标志着探测效果达到最优。在此基础上,将自适应参数的后验推断与目标函数的遗传优化过程相融合,提出了迭代贝叶斯推断遗传探测算法IBIGDA。实验表明,即使缺乏与系统或攻击相关的先验参数,IBIGDA算法仍能有效探测常见托攻击,具有较高的无监督程度,符合实际应用需求。–普适性是除无监督性外决定托攻击探测技术实用价值的另一个重要因素。针对现有托攻击探测技术难以兼具这两种特性的问题,本文以数据非随机缺失机制为依托,解析了导致评分缺失的潜在因素,并将这些潜在因素与Dirichlet过程一齐纳入概率产生模型的框架,提出了缺失评分潜在因素分析模型LFAMR。本文在利用LFAMR进行用户聚类的基础上,给出了理想状态下攻击类的识别方法,从而达到了探测托攻击的目的。实验表明,LFAMR在普适性及无监督性方面优于现有的攻击探测技术,无需用户类数等先验输入,能够准确探测常见托攻击及其变体形式。鲁棒推荐技术重点关注在不依赖托攻击探测技术进行数据预处理的前提下,如何增强推荐算法的内在防御能力。在此方面,本文分别研究了基于存储的和基于模型的鲁棒推荐技术。主要工作包括:–针对传统的基于用户的推荐算法对托攻击的高度敏感性,本文在先前关于攻击概貌群体效应的工作基础上,通过考查托攻击前后目标用户最近邻的统计特征,设计出一种攻击概貌在线过滤器,用于将攻击概貌从目标用户的最近邻中滤除,并用这种过滤器改进了基于用户的推荐算法的最近邻选取策略,从而提出了基于攻击概貌在线过滤器的协同推荐算法CROFAP。实验表明,攻击概貌在线过滤器能够准确识别并滤除多数攻击概貌,确保了CROFAP算法的鲁棒性。–用户与项的元信息对于增强推荐系统鲁棒性具有重要利用价值。以此为设计思想,本文首先提出了基于概率潜在语义分析的用户嫌疑性评估策略,而后将用户嫌疑性与项类属等元信息分别以模型参数和Logistic回归方式融入贝叶斯概率矩阵分解模型,提出了元信息增强变分贝叶斯矩阵分解模型MVBMF,并设计了基于鲁棒线性回归的模型增量学习策略,降低对模型重构的需求。实验表明,MVBMF能够有效抵御托攻击的侵害,强弱泛化水平也达到了较高程度。