面向协同过滤的推荐攻击特征提取及集成检测方法研究

来源 :燕山大学 | 被引量 : 0次 | 上传用户:w53839250
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
协同过滤推荐系统能够依据建立的用户概貌,过滤出用户感兴趣的信息并主动推荐给用户,可以有效解决互联网上出现的“信息过载”问题,已经被广泛应用在电子商务等诸多领域。然而,由于协同过滤推荐系统自身所具有的开放性,攻击者出于商业竞争等目的,人为地向系统注入大量虚假的用户概貌,企图使系统产生对他们有利的推荐结果。这种“托”攻击或推荐攻击给协同过滤推荐系统带来了极大的安全隐患。为了消除推荐攻击产生的安全隐患,关于推荐攻击检测方法的研究受到广泛关注。本文在对国内外研究现状综合分析的基础上,进一步对推荐攻击特征提取及检测方法进行了深入探讨。首先,针对已有专用特征提取方法不能有效描述已知类型推荐攻击的问题,通过引入Hilbert-Huang变换、词频-逆向文档频率和互信息,提出一种推荐攻击专用特征提取方法。在分析已知类型推荐攻击的基础上,利用Hilbert-Huang变换、词频-逆向文档频率和互信息,提取已知类型推荐攻击的专用特征,作为检测已知类型推荐攻击的基础。其次,针对已有通用特征提取方法不能有效描述未知类型推荐攻击的问题,通过引入信息熵,提出一种推荐攻击通用特征提取方法。从用户评分分布的角度,利用信息熵提取未知类型推荐攻击的通用特征,作为检测未知类型推荐攻击的基础。再次,针对已有有监督检测方法误报率太高的问题,提出一种基于支持向量机的推荐攻击集成检测方法。利用上述提出的专用特征提取方法提取用户概貌的特征,利用随机采样技术生成有差异的基训练集,利用生成的基训练集训练支持向量机生成基分类器,对测试数据进行检测,采用多数投票机制融合基分类器的检测结果。然后,针对已有检测方法不能有效检测未知推荐攻击的问题,提出一种基于仿生模式识别的未知推荐攻击集成检测方法,利用上述提出的通用特征提取方法提取用户概貌的特征,利用仿生模式识别技术覆盖真实概貌样本,将覆盖范围之外的用户概貌判断为攻击概貌,在此基础上,通过调整覆盖范围的大小生成基分类器,检测测试数据,采用多数投票机制融合基分类器的检测结果。最后,在MovieLens数据集上与相关工作进行了实验对比,验证了所提方法的有效性。
其他文献
本文介绍了第三方物流及其供应链管理的概念,探讨了第三方物流进入供应链管理的理论基础。分析了第三方物流和供应链之中核心企业的关系,探讨第三方物流在供应链管理中的特点
本文根据流体淌度的概念定义了双峰孔隙度,.据此,完全亲水储集层的孔隙系统分为两部分。其一为微孔隙.它对储集层渗透率影响很小.无法测出;另一部分为宏孔隙.它决定储集层渗透率及相
目的研究紫茉莉根两种提取物的抑菌效果。方法分别用水提取法和95%乙醇提取法制备紫茉莉根水提取物和醇提取物,利用倍比稀释法进一步制备含有不同质量浓度紫茉莉根水提取物和
首先对农产品冷链物流进行了阐述,并对美国和我国农产品冷链物流的发展现状进行了描述,对存在的问题进行了分析,最后对我国农产品冷链物流的发展提出了有益的建议和对策。
目的探讨术后重建修复对口腔肿瘤切除患者生活质量的影响。方法本研究设计使用两种不同问卷,调查术前和术后3、6及12个月内患者生活质量的变化情况:华盛顿大学生活质量和头部
目的探讨中医护理在促进中风偏瘫患者康复中的应用效果。方法选择2017年1~12月在我院诊断治疗的中风患者100例为研究对象,随机分为干预组与对照组各50例。干预组采用中医护理,
近年来,南通市机动车保有量大幅增长。受机动车尾气污染影响,城市空气污染已由煤烟型污染向交通尾气型污染转变。控制机动车尾气污染,已成为大气污染防治的重点工作之一。本
针对设立死刑复核期限的主张,反对者从公正、人权、死刑民意、程序拖延利益等角度提出了针锋相对的批判,但这些观点本身并不成立,死刑复核期限具有坚实的制度基础。遵循充分、适
本文研究了葛根取汁方法及用α-淀粉酶、糖化酶水解葛汁中淀粉,制造清亮葛根饮料的工艺。并对各工艺参数对饮料的质量和稳定性的影响进行了探讨,较好地解决了保留葛根营养和