社交网络恶意用户识别检测方法研究与实现

来源 :北京交通大学 | 被引量 : 1次 | 上传用户:lsssyd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
微博作为一种流行的社交网络工具,吸引了众多网民的使用和参与,加快了信息的传播,提升了互联网的经济价值。与此同时,一些恶意用户的行为,也对人们造成了伤害,对虚拟网络环境和现实社会带来了恶劣的影响。如何有效识别出这些恶意用户,一直是社交网络建设和发展中的一个重要问题和热点研究方向。本文以新浪微博为对象,研究微博恶意用户的识别方法,从用户特征分析和构建学习模型的角度,对恶意用户进行识别。主要工作包括:首先进行特征数据集的获取和整理,在进行人工数据标注的基础之上,利用半监督聚类算法进行数据标注,并对原始特征提取和目的进行分析。引入了SVMRFE,基于随机森林的特征选择方法和PCA降维三种特征分析方法,并逐一进行了实验,挑选出各方法的最佳特征集合。其次,引入了两种机器学习模型。第一,在实现先前流行的机器学习模型基础之上,引入了集成学习性能较为突出的XGBoost算法,对其原理和特征选择策略进行了介绍。第二,以传统全连接神经网络为基础,根据微博用户特征的关联分析,提出了一种基于特征关联性的集成神经网络(INN-FA),并对Adam优化器进行了介绍。实现了两类模型的搭建与验证。通过比较普通机器学习算法和集成学习模型,并与全部微博原始特征集和不同特征选择算法筛选出的特征集合进行交叉实验,得出集成学习方法普遍优于普通机器学习算法,并且SVM-RFE+XGBoost组合方法可获得96.54%F值的最佳性能。在特征选择方法对比上,SVM-RFE的普适性要优于基于随机森林的特征选择和PCA方法。针对神经网络模型的比较,采用Tensorflow深度学习框架搭建Adam+INN-FA模型,对比特征选择前后的全连接深度神经网络和使用传统梯度下降方法的INN-FA模型,以95.49%的F值验证了Adam+INN-FA模型在识别性能上的有效性。同时该模型的独特优势在于能够降低结构复杂度,增强了特征输入灵活性。最后,为了进一步验证提出模型的通用性,选取Twitter公开数据集对模型进行验证,实验结果表明,使用全部30个原始特征,在神经网络的对比上,Adam+INNFA模型的性能媲美全连接神经网络,同时XGBoost算法在全部数据集上的性能最好,略优于原作者提出的随机森林模型。进一步对该数据集进行特征选择,保留了8个重要特征的SVM-RFE+XGBoost组合方法仍能以97.68%的F值优于其他特征选择组合模型和使用原始数据集的其他模型,证明了该组合模型的有效性。
其他文献
射频感性耦合等离子体(Radio-Frequency Inductively Coupled Plasma,RF-ICP)源可以利用简单的装置在低气压条件下产生高密度等离子体,因此被广泛地运用在工业生产中。在微电
为了顺应时代进步和国家发展对人才培养的要求,我国也在不断进行更适合于我国国情的课程改革。2017年,教育部印发了普通高中化学课程标准(2017年版),具体明确了化学学科核心素养是学生必备的科学素养,是学生终身学习和发展的重要基础。培养学生全面发展、具备终身学习的能力是教师教学的终极目标,培养化学学科核心素养是化学教学工作者的总方向性指导。所以,作为义务教育一线的化学教师,进行教学实践时应具备超前意
学位
动机一直是二语习得领域的热门研究话题。作为激发并维持个体学习行为的内部启动机制,学习动机的强弱直接影响学习效果。强烈的学习动机可以使学生主动学习并热爱学习。根据其复杂的动态系统性,在2005年,D?rnyei提出二语动机自我系统理论,由此开始了从全新角度对动机的研究。当前,结合2020年新修订的高中英语新课标的政策,我国英语教学更加注重对学生英语交际能力的培养,而学生的交际意愿直接影响他们是否愿意
学位
近年来,借助深度学习的强劲表现,计算机视觉中的主要任务之一 2D目标检测的研究也取得了巨大的突破,并广泛应用在社会各界中。但是,2D目标检测仅仅是在平面图图像中检测并定位目标,由于缺少关键的深度信息,不能应对自动驾驶、移动机器人等应用中的挑战。和2D目标检测仅仅在平面图像中检测目标不同,3D目标检测需要结合深度信息,对真实立体空间中的物体进行检测,提供诸如目标的位置、物理大小以及目标方向等空间场景
波长在13.5nm的极紫外光刻技术作为传统光刻技术的延续,已被认为是下一代最先进的光刻技术之一。激光产生等离子体(LPP)方法在产生极紫外光源时具有较高的转换效率,低碎屑,光
7系铝合金拥有高强度重量比、抗腐蚀性强以及导电率高等优异性能,它们往往成为大塑性变形法制备机械性能更高的超细晶材料的首选。然而高强度铝合金在室温下难以变形,加上室
Ti2AlNb合金具有优异的比强度、良好抗氧化性能和抗蠕变性能,服役温度达650℃-750℃,成为航空航天领域备受青睐的材料。在Ti2AlNb合金中添加Mo元素,促使体心立方结构B2相向正
镍基高温合金作为一种难加工材料,同时作为航空航天材料的重要组成部分,其切削加工过程存在切削力大、切削温度高、刀具磨损严重等问题,这些问题在半密闭空间内的钻削场景下
蒙古马精神形成于中国特色社会主义新时代,是以爱国主义为核心的民族精神和以改革创新为核心的时代精神深度融合的智慧结晶,是以社会主义核心价值体系为精髓的社会主义先进文化的具体体现。随着时代的发展,蒙古马精神的内在价值和现实意义日益凸显。“吃苦耐劳、一往无前,不达目的决不罢休”为主要内涵的蒙古马精神是中华民族精神的重要组成部分。蒙古马精神作为一种非常宝贵且具有独特性的教育资源,同时也蕴涵着丰富的育人功能
学位
粮食产量对于属于农业大国的中国而言具有至关重要的影响力,土壤中有机质的含量是影响粮食产量的一个重要元素,如何监测农田土壤中有机质的含量是当前研究的重要问题。目前,国内外在农田土壤有机质含量监测方面取得了很多的研究成果,但是大部分都是通过人工现场实地采集土壤样本利用化学方法检测,或者通过检测仪器现场采集土壤有机质含量数据,缺少智能化自动采集数据的远程监测系统。为了实现大面积农田土壤有机质含量远程监测