针对托攻击与自然噪声的鲁棒推荐算法研究

来源 :西安电子科技大学 | 被引量 : 0次 | 上传用户:soundbo
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
大数据时代下推荐系统应运而生,推荐系统就是根据用户与项目的已知相关信息,然后预测该用户的后续行为。推荐系统区别于传统搜索引擎被动输出用户需要信息的方式,其通过用户与项目的个体信息、用户与系统的历史交互信息和交互的外界环境信息,构建用户兴趣模型,主动为用户推荐兴趣列表。然而推荐系统的原始数据中经常存在着人为噪声与自然噪声,其一直影响着推荐系统获得准确的用户偏好模型。人为噪声就是在推荐系统中注入虚假评分数据的用户,又称之为托用户,这种行为称之为托攻击。自然噪声则分布于整个评分矩阵,与托用户不同。  针对托攻击用户传统的托攻击检测算法虽然有较高的检测精度,但是其必须对特定类型的托攻击模型去人为的分析与设计对应的属性检测指标,所以缺乏自动化。本文为了克服这种问题,将深度学习模型中的栈式自编码器引入托攻击检测。其首先将每个用户评分向量归一化,然后输入栈式自编码器进行逐层训练,预训练完毕再进行整体微调,最后直接输出用户特征向量,实现了端对端的特征提取。所以将栈式自编码器引入到托攻击检测中的用户特征提取模块,降低了人为参与程度,经实验验证在两个标杆数据集上相对于其它算法,检测结果的精确度、召回率和综合指标均获得了较好的结果,其减少了设计属性检测指标的步骤,从而增强了托攻击检测的自动化程度。基于栈式自编码器的托攻击检测算法最终降低了托攻击用户对推荐算法的影响,使其表现的更加鲁棒。  针对分布在数据集中的自然噪声,本文将局部低秩的假设引入概率矩阵分解(Probabilistic Matrix Factorization,PMF)的框架中,从而得到局部概率矩阵分解算法(LocalProbabilistic Matrix Factorization,LPMF)。在局部低秩矩阵近似算法(Local Low-Rank Matrix Approximation,LLORMA)的实现过程中,原本完整的训练数据集被划分为了多个局部数据集,导致训练数据集进一步稀疏,但是PMF则在大规模的、稀疏的和不均衡的数据集上表现优异。所以LPMF学习特定数量的局部模型,然后以权重累加的方式预测最终评分,这种举措缓解了 PMF中过拟合的问题和 LLORMA算法中数据集稀疏性低的问题。因此LPMF结合了以上两种算法的优点,而又互相弥补了对方的缺点,经实验验证在不同的数据集上均获得了更高的预测评分精度。
其他文献
  本文选定高比表面积导电炭黑、活性炭、廉价的氧化锰作为超级电容器的电极材料,结合多种电化学研究手段和材料研究测试方法,系统地研究了超级电容器的材料制备、电解液的选
宜家作为北欧家居设计风格的典范风靡全球,在产品设计中追求低廉的成本、自然时尚的风格、个性化的家具设计以及自由随意的组合方式。其产品以天然环保的材料、创新性的造型
随着传感器技术、微系统技术、无线通信技术、计算机技术的飞速发展,无线传感器网络应运而生。在此基础上发展起来的工业无线网络,以其成本低、耗能低、扩展性强等特点,对现
目前无线定位技术是Zigbee无线传感器网络研究的热点问题之一,随着定位需求与应用的增加,如何提高基于Zigbee技术的无线定位系统的定位精度是Zigbee无线传感器网络领域亟待解
目的:  电阻抗法是基于不同环境下,细胞的电阻和电容随不同的频率变化而改变,是一种非侵入性、实用的技术。本论文以人胃癌细胞 MGC803的阻抗特性和细胞悬浮液中纳米二氧化钛
近年来,人们的工作压力日趋增大,由此带来的心理压力导致消化道黏膜疾病的发病率不断上升。消化道黏膜疾病以及进一步恶化引发的消化道癌变成为了国民健康的最大杀手之一。研
鲁棒性主成分分析(RPCA)作为低秩矩阵恢复理论框架中重要的组成部分,主要解决观测矩阵中低秩分量和稀疏分量的分解问题,广泛应用于图像处理、音频处理、雷达信号处理等领域。线
奶牛是我国重要的产乳经济动物之一,奶牛乳腺泌乳功能会影响乳产量和乳蛋白的含量。蛋白质组学中一个重要的研究部分是蛋白质的翻译后修饰,而其中以磷酸化修饰最普遍、最重要
随着人们绿色健康意识的加强,生物防治的相关研究成为一个热点。昆虫病原真菌作为一种生防制剂已受到极大关注。本课题以蝉拟青霉(PaecilomycescicadidaeMiquelsamson)为供试
在典型的资源分配系统中,生产流程互相等待彼此占有的资源会导致系统死锁,进而造成生产的停滞和系统开销上升,使系统性能严重恶化。Petri网是资源分配系统的主要建模工具之一