论文部分内容阅读
随着互联网技术的不断发展,以Facebook, Twitter为代表的在线社交网络成为了人们相互之间交流的重要途径。而在国内,微博更是成为时下最热门的在线社交网络。然而,微博中还充斥着大量的利用微博传递恶意信息、实施恶意行为的恶意用户,对微博生态和微博中正常用户的隐私和财产安全构成了威胁。因此,关于反恶意用户方法的研究具有很大现实意义,这其中就包括恶意用户识别技术。当前,微博恶意用户识别的研究主要集中在两个方面,一是基于恶意信息内容与统计特征分析,二是基于恶意用户的行为特征和用户关系。研究者们或从一个方向,或从两个方向同时着手,取得了大量的研究成果。然而目前的方法普遍只能利用二分类方法简单区分恶意用户与正常用户。本文承袭前人经验,从微博及其恶意用户行为研究入手,依照恶意用户行为策略,对恶意用户进行了更为系统的分类。结合博弈论建立了正常用户与恶意用户之间的行为博弈模型,并以模型为基础对微博用户的谨慎程度进行定量计算。通过谨慎度,强化了微博用户行为特征对正常用户和恶意用户的区分能力。最后应用基于置信度的多蚁群随机游走(CARW)算法对恶意用户进行识别。本文的主要工作包括以下几方面:首先,本文针对当前恶意用户分类不够清晰的现状,对恶意用户类型进行了更为系统的划分。研究过程中,通过更为多样的途径对微博中的恶意用户样本及相关数据进行采集,经过对用户样本在实施恶意行为过程中行为策略的观察与研究,重新划分恶意用户的类型。在此基础上,本文对各类用户的行为特征进行了定量分析和对比。随后,为了应对恶意用户针对当前识别方法做出的适应性改变,本文利用博弈论建立了正常用户与恶意用户之间的行为博弈模型,并通过行为博弈模型对用户的谨慎度进行了求解。利用谨慎度对用户的行为特征进行调整,有效抵消了恶意用户通过模仿普通用户行为对一般识别方法带来的干扰。通过实验证明,利用通过用户行为博弈模型求解出的谨慎度有效提高了识别算法的性能,综合提高比例达到5%。最后,针对传统恶意用户识别方法不能够对恶意用户进行多类分类的不足,本文在使用谨慎度对用户行为特征调整的基础上,采用CARW算法对微博中恶意用户进行识别。实验结果证明,算法不仅能够有效识别出微博中的恶意用户,还能够对其所属的用户类型进行归类。其中将恶意用户正确归类的准确率可以达到50%以上,识别出恶意用户的准确率接近90%。