基于深度学习的在线社交网络中的恶意帐户分类

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:leolee19820604
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
恶意检测是预测在线社交网络(OSN)中异常帐户或节点的问题。由于该问题适用于多种任务(例如恶意URL或用户内容分类),因此已引起计算机安全领域研究人员的广泛关注,识别恶意帐户的问题也得到了广泛研究。但是,常规方法,例如基于规则的统计方法、甚至一般的学习方法,都无法应对用户和数据量不断增长的动态环境。因此,基于用户特征分析来检测恶意内容类型(例如垃圾邮件和恶意软件)的学习模型成为当前研究的热点之一。本文专注于恶意帐户分类,主要利用二分类的概念和学习方法。首先,本文收集了广泛的OSN特征数据,包括用户配置文件、文本内容和URL网址信息等作为实验数据集。在此基础上,利用在多个领域取得广泛成功的深度学习技术,本文研究了一种具有学习功能的分类器,以优化分类结果。同时,本文对与恶意帐户问题有关的多个方面进行了深入研究。最后,将本文方法与当前一些主流方法进行了实验比较,表明本文方法对恶意帐户识别具有更高的准确性。本文在恶意帐户分类方面的主要贡献包括以下方面。首先,提出了一个具有大规模OSN数据集的动态CNN模型,其中包括一个URL列表、用户注释和用户配置文件,以构建基准数据集。利用这一基准数据集,通过提取各种OSN特征来构建有效的分类模型。为了对恶意帐户问题进行识别,采用监督学习方法对的恶意用户和正常用户进行区分。其次,提出了一种具有池化函数的深度学习分类模型。不同于一般的分类器模型,本文在深度学习网络模型的隐层中设计了具有动态池化作用的池化函数,以提高神经网络训练的准确性。URL分类是OSN阶段预连接前进行恶意帐户检测的关键一步。为此,将本文方法应用于URL特征数据集,对URL进行分类。根据实验结果,本文提出的具有高斯函数的RunPool池化操作的深度学习分类模型可以产生更高的精度,并且损失分数很小。再次,提出了一种具有所谓RunOut正则化函数的用于对恶意评论进行分类的学习方法。将正则化函数应用于深度学习分类模型的隐层,可以有效地解决神经网络的过拟合问题,改善模型的训练结果。实验表明,该模型在用户评论数据集的恶意帐户检测方面可以取得很好的效果。最后,提出了一种具有名为RunMax激活函数的深度学习分类模型。本文在CNN的最后一层开发了一个名为RunMax的函数作为激活函数。它是一种通用的激活算法,可以提高神经网络的性能,用于训练用户属性数据集。通过使用RunMax,在相同的调整参数和实验环境下与其他学习算法相比,本文算法可以对假账户获得更高的识别精度和很小的成本损失,具有更好的性能。
其他文献
目的复方绿柳颗粒(LvLiuKeLi,LLKL)由绿萝花(Edgewortahi gardneri(Wall.)Meisn.)、柳茶(Sibiraea angustata)、藏红花(CrocussativusL.(saffron))组成,本研究观察LLKL改善2
随着当前工业化和智能化的发展需求,实际应用中出现大量的多解优化问题,如多解路径规划、多目标投资组合优化等工程与科学领域的问题,这些问题都具有多变量、多峰值、多约束
基于IP传输网络的视频会议系统并不具有传统电信专网所提供的低延时、低抖动、带宽保障的优点,这主要是由于IP网络是基于无连接分组交换设计的,提供的是“尽力而为的”服务,
随着社会智能化、数字化进程的快速发展,视觉数据(如图像、视频等)作为一种简单直接、内容丰富的信息呈现方式,已广泛渗入到现代生活的方方面面。人们在创造、分享及传播视觉
对于面部表情来说,既能够将人的情绪变化体现出来,也能够将人的喜怒哀乐表达出来。长期以来,人们都通过表情来对人的情绪变化进行研究,尤其是通过人工智能手段来识别人的面部表情。对于微表情来说,它是没有意识的、最真实的表情之一,可以将人当前的真正情感体现出来,慢慢成为了学术研究者们研究的热门方向。微表情的变化是非常微小的,这使得微表情的研究非常困难。这种表达方式是不能伪造和压制的,因此也成为了判断人们主观
随着目前移动互联网技术的高速发展,智能移动终端在消费市场中迅速崛起,成为人们生活中不可或缺的生产生活工具。安卓(Android)作为一。款面向移动端的智能操作系统,自2011年
小学班主任是小学班级教育工作的组织者和领导者,是学生管理工作的责任人,是帮助小学生德、智、体、能全面发展的指导教师,是联系班级中各科教师的纽带,是沟通学校与各种学生组织、家庭和社会的桥梁。作为小学班主任就必须具备足够的胜任力来完成班主任这个工作,从而促进教育的发展,学生的发展。因此本文从“小学班主任胜任力”这一角度,选取延吉市小学班主任作为调研对象,对小学班主任胜任力现状进行调查,从中发现问题,并
新测序技术的数据产生能力已经超越著名的摩尔定律,当前基因组数据正以12-18个月10倍以上的速度增长。数据处理所耗费的时间、人力与经济开销在整个测序流程中所占的比重越来
随着信息时代的来临,人工智能从学术研究转变为应用驱动,智能系统用于认知、识别、分析和决策等方面,其本质和最终目标是模拟人类意识与思维的过程。由于大量数据、复杂的深
目标覆盖问题是无线传感网络(WSNs)中的一个基本问题。以往对目标覆盖问题的研究,大多基于0/1圆盘感知模型,这种监测模型是一种理想化的模型。近年来,人们提出了一种更加符合实际应用场景的概率感知模型。在基于概率感知模型的传感网络中,目标通常需要多个传感器联合监测,因此0/1圆盘感知模型并不适用于概率目标覆盖问题。此外,传统WSNs中的传感器节点由有限容量的电池供电,网络寿命受到能源的限制。随着能量