【摘 要】
:
近年来,随着社会经济快速发展,互联网使商品数据呈指数爆发式增长,推荐系统能够帮助人们从海量商品信息中找到相关或喜好的商品,且促进商品经济的发展。但是由于互联网推荐系统开放性较强,导致部分用户可以通过注入伪造的用户信息,对推荐系统中的目标项目的排名进行更改。因此上述的攻击行为在一定程度上干扰了推荐系统的正常运行,从而导致推荐系统的应用和推广受到阻碍。鉴于此,本文提出了两种推荐系统下的托攻击检测的改进
论文部分内容阅读
近年来,随着社会经济快速发展,互联网使商品数据呈指数爆发式增长,推荐系统能够帮助人们从海量商品信息中找到相关或喜好的商品,且促进商品经济的发展。但是由于互联网推荐系统开放性较强,导致部分用户可以通过注入伪造的用户信息,对推荐系统中的目标项目的排名进行更改。因此上述的攻击行为在一定程度上干扰了推荐系统的正常运行,从而导致推荐系统的应用和推广受到阻碍。鉴于此,本文提出了两种推荐系统下的托攻击检测的改进算法,具体研究内容如下:(1)针对已有的托攻击分类属性分辨率不高和无监督攻击检测算法准确率较低的问题,本文提出基于改进K均值聚类的托攻击检测算法。该算法引入用户声誉IGR分类特征属性,从而使改进后的K均值聚类算法能够把大部分攻击者聚集在一起。同时,由于聚类后的攻击用户集合中存在真实用户被误判的问题,且考虑到攻击用户的评分间隔时间较于正常用户非常小,提出用户评分间隔加权的RDMA(Score-RDMA,SRDMA)算法对其进行二次分类,最终减少了托攻击对推荐系统造成的影响。实验结果表明,本文提出的基于改进K均值聚类的托攻击检测算法可以有效检测托攻击概貌模型,与对比算法比较,其检测效果更优。(2)针对含有正常用户和攻击用户的不平衡数据集影响托攻击检测精度的问题,本文提出基于改进集成学习的托攻击检测算法。分别在数据预处理和分类方面进行研究分析。首先在解决类别不平衡问题的经典数据合成方法SMOTE的基础上提出改进算法P-SMOTE。P-SMOTE算法在数据预处理阶段对数据过采样前,先计算了各个样本点之间的Pearson相关系数,然后根据Pearson相关系数的比较来确定样本插值的系数,最后具体特异性地进行插值操作。这样不仅改进了数据的不平衡性,而且在保证不存在过拟合的情况下充分考虑了样本的分布规律,可以在一定程度上促使最终的分类效果更好。同时,鉴于托攻击与正常用户在评分变化幅度上的差异,且集成学习能够很好的解决过拟合的问题,提出基于加权熵的Adaboost-SAMMA算法(Adaboost-SAMMA Based on Entropy,E-SAMMA)对数据集进行托攻击检测的分类,实验结果显示E-SAMMA算法在攻击检测分类效果上优于对比算法。
其他文献
区块链技术具有去中心化、可追溯、不可篡改性等优点,被认为是下一代互联网颠覆性核心技术。随着区块链技术的快速发展,其广泛应用于金融服务、智能制造、供应链管理、文化娱乐、社会公益、政府监管、溯源等领域,为构建智能社会提供了基础。然而现有区块链系统在交易查询方面性能较弱,通常需要遍历整个区块链数据,同时在查询语义方面也较为简单,只支持交易Hash、区块号、时间戳等相关条件查询,不能满足用户基础查询需求。
在农业机械中,磨损失效占机械零部件失效的70%以上,造成了巨大的经济损失。为提高农机关键零部件的耐磨性,研发高性能耐磨新材料及在零件表面应用耐磨涂层技术是两个重要解决途径。Sialon是一种典型的氮氧化物陶瓷,因其具有优越的力学性能、热学性能与化学稳定性,被认为是最具潜力的高温结构陶瓷之一。目前,合成Sialon技术要求高,多采用纯原料制备,成本高,难以实现大规模工业生产,制约了其在工程中实际应用
黄果枸杞是枸杞的变种,含有多糖、多酚、甜菜碱等生物活性成分。其中,酚类物质的含量和种类对枸杞生物活性,尤其是抗氧化活性有重要影响。但目前对黄果枸杞酚类物质的研究主要为含量测定,而关于酚类组分分析、消化稳定性以及对肠道健康作用的研究尚未报道。因此,本研究选用四份不同品种的黄果枸杞,分别采用福林酚法、亚硝酸钠-硝酸铝比色法和高效液相色谱法,分析总多酚、总黄酮和酚类组分含量,并评价了四份不同品种黄果枸杞
随着国家经济和工业的发展,作为炼钢的主要设备,电弧炉容量越来越大,特别是交流电弧炉对电网电能质量的影响也愈加严重。当电弧发生短路或断路时,不仅会产生稳态电能质量问题,还会出现电压暂降等暂态电能质量现象。对于电弧炉电能质量的研究已经进行了多年,但是电能质量问题依旧突出,如何建立适合暂态电压分析的精确的交流电弧炉模型以及如何对电弧炉电能质量进行改善仍是亟待解决的课题。本文聚焦交流电弧炉暂态电能质量问题
传感器固有的采样频率限制了图像的空间分辨率,空间分辨率是决定图像质量的重要因素,高分辨率有利于图像的进一步分析处理。图像超分辨率方法利用单幅或多幅低分辨率图像,为低分辨率图像恢复或重建合理的高频成分,突破传感器固有采样频率的限制,从而达到提升图像空间分辨率的目的。由于同一时间、同一场景的多幅低分辨率图像不易获取,因此单幅图像超分辨率方法更具有通用性。此外,现有的超分辨率方法大多假设模糊核已知,而实
材料表面浸润性在工程中具有潜在的应用前景,接触角作为浸润性的一种直观表征,在近年来的研究中备受关注。但迄今为止,接触角的计算方法仍存在争议。复合材料能够实现材料性能的高效应用,其表面浸润性特征成为另一研究热点。本论文运用分子动力学模拟方法,系统性地研究对比了用于接触角测量的密度轮廓法(二维和三维模型)和液滴高度法,此外,研究了两种简单复合材料表面的浸润特性。本文的研究结果不仅对分子动力学以及第一性
延展性表征了材料在拉伸荷载作用下的塑性变形能力,是材料最重要的力学性能之一。石墨烯作为近年来最受关注的碳纳米材料之一,其力学性能受到广泛关注。现有研究表明,室温下单层石墨烯材料沿扶手椅和锯齿型手性方向拉伸的极限断裂应变分别为21%和14%。一旦应变超过断裂应变,石墨烯将以脆性断裂方式迅速失效。石墨烯较低的断裂应变、较差的延展性和剧烈的脆性破坏方式极大地限制了其应用。为了改善石墨烯材料较差的延展性,
聚类是一种非常重要的无监督学习方法,它通过计算样本之间的相似度,能够将相似的样本划分到同一个簇,不相似的样本划分到不同的簇,在数据挖掘任务中具有简单、高效等优势。直觉模糊聚类算法作为一种模糊聚类算法的一种推广,能更清晰地描述客观世界中模糊信息,因而在各个领域被广泛应用。但该算法仍然存在许多问题,如初始隶属度矩阵对聚类结果影响较大、对噪声和孤立点较为敏感等。因此,本文对该算法的上述问题进行研究,并提
抗生素的广泛使用导致沙门氏菌的耐药问题日趋严重,给人类和动物健康带来极大威胁。长期以来,大量学者以及政府部门对食源性沙门氏菌的药敏性、耐药菌株携带的编码基因做了广泛的调查和监测,然而仍缺乏在耐药基因检测中用作参比的标准样品。为了更好、更快、更精准地了解介导食源性致病菌携带的耐药基因和相关耐药机制,检测过程标准菌株的使用非常必要。本研究将筛选出耐药程度高、耐药基因遗传稳定的沙门氏菌,进而使用这些菌株
图像超分辨率重建作为计算机数字图像处理领域的热点研究方向,该技术在实际中已经被广泛应用于军事、医学、监控和遥感等众多领域。近几年来,深度学习在图像处理领域被广泛应用,并在图像超分辨率重建技术的研究上取得重大突破。然而,目前基于深度学习的图像超分辨率重建技术仍存在一些不足,第一,对待图像中的高频细节信息和低频全局信息缺乏区分度,不能高效的利用高频特征,导致重建图像缺少纹理细节;第二,只能提取单一尺度