用户评论社交网络中的女巫攻击检测技术的研究

来源 :上海财经大学 | 被引量 : 0次 | 上传用户:wang1hnsc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的发展以及移动设备的普及,社交网络已经成为用户在线获取以及分享信息最便捷的服务之一。在各类社交网络中,用户评论社交网络,例如Yelp、亚马逊和大众点评等网站,已经成为用户进行信息分享和商品推荐的热门平台,用户可以在这些平台上便捷地发布或获取商户的各类信息以及他人的评价。这些评论信息通常可以为用户带来帮助,并被社交网络推荐给其他用户加以参考,例如大众点评上的优质评论等,然而这些评论的真伪难以确定,其真实性受到女巫(Sybil)攻击的威胁。为了解决虚假评论造成的女巫攻击问题,以往的解决方案可以大致分为用户行为检测以及评论文本检测。前者大多使用间接/直接图模型或用户文件来检测虚假账号,进而确定其发布的评论信息属于虚假信息。然而,这些方法所需要的数据由用户评论社交网络的运营商单独保存,或者依赖于强有力的假设。后者采用自然语言处理算法学习虚假评论的文本特征,可以对已经出现过的虚假评论做到较好的检测效果。然而,虚假评论的迷惑性较大,攻击者经常会对评论内容进行增删和替换以逃避平台的检测,在不同的时间段以及不同类别的商户下往往会有不同的版本出现。而这类检测方法实时性较差,难以识别新出现的虚假评论。这就对现有的女巫攻击检测算法提出了挑战。综上所述,用户评论社交网络中的虚假评论检测主要面临以下三个问题:第一,目前各平台都有一定的评论过滤机制,但是这些谣言检测方法不对外公开,用户无法确定平台推荐的评论是否可信;第二,虚假评论的形式千变万化,对于新出现的虚假评论往往缺乏足够的历史数据,因而难以对其进行判断;第三,而从虚假评价检测任务本身来说,虚假评价越早发现越好,这就要求检测系统能够在较短时间内得出检测结果,或者检测模型拥有较好的泛化能力。针对以上提出的问题,本文从两个角度展开了研究。一方面,本文提出了一种基于用户行为特征的女巫攻击检测模型,通过构建熵值提取并描述用户特征,并与传统的基于行为的特征相结合,设计了一种基于二值分类的女巫攻击检测模型,能够快速检测女巫攻击者;另一方面,本文设计了一种基于生成对抗网络的女巫攻击检测模型。该方法采用文本特征抽取器、虚假评论检测器以及评论类别鉴别器三部分作为该模型的网络结构。模型通过文本特征抽取器提取文本特征并输入虚假评论检测器进行检测;评论类别鉴别器基于每条评论的隐藏信息,不断发现评论文本中包含的与特定类别相关的信息,进而识别出每条评论的类别标签。特征抽取器试图欺骗鉴别器使鉴别损失最大化,鉴别损失越大说明不同类别的区别越不明显,也就意味着学习到的特征是与类别无关的共性特征。特征抽取器和虚假评论鉴别器之间的极大极小博弈构成对抗网络,使得模型最终得到与评论类别无关的虚假评论特征,增强了模型的泛化能力。最后,我们在通过爬虫获取的大众点评数据集上进行验证,通过与其他虚假评论检测方法进行对比,发现我们提出的两种检测模型在同类方法中拥有优势,同时我们还对两类检测方法进行了比较和分析,对比得出两者各自的优缺点,并讨论了未来改进方向。
其他文献
目的 探讨团队协作式护理在新生儿肺透明膜病(NHMD)治疗中的应用效果。方法 90例NHMD新生儿按照入组顺序分为两组,对照组采用常规护理,观察组采用团队协作式护理,比较两组的恢复情况、并发症及家属满意度。结果 观察组的机械通气时间、 NICU住院时间及PS使用次数均少于对照组,并发症发生率低于对照组,CCFSS各维度评分均高于对照组(P <0.05)。结论 团队协作式护理可缩短NHMD新生儿的住
期刊
在实际问题中,数据的不确定性是对优化问题进行精确求解的一大阻碍,因此传统的优化模型在解决实际问题时稍显无力.近年来一种针对含有随机变量的优化模型求解的方法——分布鲁棒优化(Distributiona,lly Robust Optimiza.-tion,DRCO)逐渐受到业界关注.分布鲁棒优化通过假定随机变量存在于一族变量(称之为模糊集)中,在变量族中对问题进行优化从而得到鲁棒解.本文考虑具有内生不
学位
极值问题是随机图领域研究的重要组成部分.本文讨论两类超图过程极值问题.一类是基于友谊传播的超图过程极值问题.在社交网络中两位陌生人之间的友谊往往更有可能发生在当两者之间拥有共同朋友.对于任意给定正整数k≥3,Hk(n,p)是顶点集合为[n],每个k元子集是以概率p生成边的随机超图.初始图G0是顶点集合[n]上完全二部图Kk-2,n-k+2,即G0包含所有与给定k-2元子集中每个顶点相关联的边.若图
学位
中国推进PPP模式具有强烈的现实需求和深层的改革意义,随着大量PPP项目落地和实施,财政风险和隐性债务问题也逐渐显露。自2015年以来,中国陆续完善了PPP财政管理制度体系,但对隐形债务的认识和防范措施仍需进一步深化。本文对PPP模式与政府债务风险逻辑关系进行梳理,从不完全契约角度、产权角度、全周期项目结构角度分析了PPP隐形债务问题的复杂性、必然性、传导性和广泛性。同时,在完善中国PPP财管制度
期刊
与在有界区间上的函数的Fourier展开类似,在随机过程理论中,Karhunen-Loève定理给出了一个由可数个正交函数的线性变换得到的随机过程的表示.然而只有很少的过程可以给出确切的特征值与特征函数,目前已知的有Brown运动和它的导出过程.大多数随机过程只能给出近似的特征值与特征函数.本文中我们主要利用了泛函分析的方法探讨了次分数Brown运动的Karhunen-Loéve特征值在足够大的n
学位
步入21世纪以来,随着人们对移动智能设备的依赖程度逐渐提升以及人工智能系列技术的普及,互联网相关产品的使用已经深入人心,同时也不断地提升人类社会的生活水平以及服务质量。伴随着智能导航系统、智能化手机等高端移动设备的普及以及全球性定位系统(GPS,Global Positional System)的发展,人们所在的地理位置的曝光和发布成为可能,用户可以选择性地让APP采集自己的位置并予以发布。基于上
学位
本文根据安徽省地方政府债务的规模和特点,分析安徽省地方政府隐性债务存在的主要问题和风险,在此基础上,基于可拓学方法构建安徽省地方政府隐性债务风险预警体系,发现安徽省的隐性债务风险位于风险预警域,偏向风险爆发域。最后,本文从短期和中长期两个层面对安徽省地方政府隐性债务风险提出具体的防范措施,为安徽省地方政府监管隐性债务,防范和化解债务风险提供思路。
期刊
金融公告作为发布金融事件的一种正规方式,其内容相较于金融新闻更具真实性和规范性,对金融事件的抽取具有重要价值。历史研究中,事件抽取技术主要针对非结构化的文本——利用自然语言处理(NLP)技术来抽取文本中的事件信息。但金融公告中不仅存在非结构化的文本,有时还存在包含事件信息的结构化的表格。表格对事件的列举更清晰和准确,并包含文本中未提及的事件信息。因此,可以同时使用金融公告的文本和表格来抽取事件信息
学位
随着知识共享经济的繁荣发展,知识共享平台的出现为用户获取信息提供了新的途径。用户既可以在知识共享平台中分享专业知识、技能和经验,同时也可以在平台中提出自己的问题或者帮助其他用户解决问题。但是,信息技术的发展也带来了信息爆炸,用户发现在知识共享平台中越来越难获取到高质量的知识内容了。因此,为了解决信息爆炸带来的“知识焦虑”问题,知识付费政策被提出。知识付费,就是知识需求者向知识提供者付费购买知识,从
学位
近年来,“互联网+”在我国已上升为国家战略,自2015年政府工作报告定调,到2017年十九大报告进一步推进网络行动计划,均意在促进新兴网络技术融入传统产业,推动中国物联网建设、移动网络购物、线上网络平台健康发展,提升国际竞争力。当前中国“互联网+”发展日新月异,企业互联网化转型即是指企业立足于互联网平台,充分发挥互联网的数据集成、信息传递和打破时空约束的作用,实现资源要素的最优配置和整合,将互联网
学位