基于深度学习的在线社交网络中的恶意帐户分类

来源 :哈尔滨理工大学 | 被引量 : 0次 | 上传用户:hdazf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
恶意检测是预测在线社交网络(OSN)中异常帐户或节点的问题。由于该问题适用于多种任务(例如恶意URL或用户内容分类),因此已引起计算机安全领域研究人员的广泛关注,识别恶意帐户的问题也得到了广泛研究。但是,常规方法,例如基于规则的统计方法、甚至一般的学习方法,都无法应对用户和数据量不断增长的动态环境。因此,基于用户特征分析来检测恶意内容类型(例如垃圾邮件和恶意软件)的学习模型成为当前研究的热点之一。
  本文专注于恶意帐户分类,主要利用二分类的概念和学习方法。首先,本文收集了广泛的OSN特征数据,包括用户配置文件、文本内容和URL网址信息等作为实验数据集。在此基础上,利用在多个领域取得广泛成功的深度学习技术,本文研究了一种具有学习功能的分类器,以优化分类结果。同时,本文对与恶意帐户问题有关的多个方面进行了深入研究。最后,将本文方法与当前一些主流方法进行了实验比较,表明本文方法对恶意帐户识别具有更高的准确性。
  本文在恶意帐户分类方面的主要贡献包括以下方面。首先,提出了一个具有大规模OSN数据集的动态CNN模型,其中包括一个URL列表、用户注释和用户配置文件,以构建基准数据集。利用这一基准数据集,通过提取各种OSN特征来构建有效的分类模型。为了对恶意帐户问题进行识别,采用监督学习方法对的恶意用户和正常用户进行区分。
  其次,提出了一种具有池化函数的深度学习分类模型。不同于一般的分类器模型,本文在深度学习网络模型的隐层中设计了具有动态池化作用的池化函数,以提高神经网络训练的准确性。URL分类是OSN阶段预连接前进行恶意帐户检测的关键一步。为此,将本文方法应用于URL特征数据集,对URL进行分类。根据实验结果,本文提出的具有高斯函数的RunPool池化操作的深度学习分类模型可以产生更高的精度,并且损失分数很小。
  再次,提出了一种具有所谓RunOut正则化函数的用于对恶意评论进行分类的学习方法。将正则化函数应用于深度学习分类模型的隐层,可以有效地解决神经网络的过拟合问题,改善模型的训练结果。实验表明,该模型在用户评论数据集的恶意帐户检测方面可以取得很好的效果。
  最后,提出了一种具有名为RunMax激活函数的深度学习分类模型。本文在CNN的最后一层开发了一个名为RunMax的函数作为激活函数。它是一种通用的激活算法,可以提高神经网络的性能,用于训练用户属性数据集。通过使用RunMax,在相同的调整参数和实验环境下与其他学习算法相比,本文算法可以对假账户获得更高的识别精度和很小的成本损失,具有更好的性能。
其他文献
近十年来,压缩感知成为信号处理领域中的研究热点之一。压缩感知技术将压缩和采样同步进行,这改变了信号的传统采样方式。压缩感知理论以可进行稀疏表示的信号为研究对象,将其压缩后通过求解欠定方程实现从低维观测值中重构原始信号。为了提高信号的重构精确度,可通过设计字典使得信号具有更好的稀疏表示形式,也可通过优化感知矩阵使得被压缩至较低维度的观测值能够尽量多的保留用于精确重构的有用信息,还可通过设计恢复算法使得信号从低维的观测值中被更准确地恢复。利用恢复算法能够成功重构信号的条件与感知矩阵的性质有密切的关系,本文以字
轮廓跟踪控制是制造业加工生产过程中常见的多轴运动控制任务,如焊接、喷涂、打磨、裁割、雕刻等等,轮廓加工精度是衡量生产质量的关键技术指标之一。目前,集中式或者点对点式的轮廓跟踪控制系统已经发展比较成熟,相关控制器产品往往采用“PC机+运动控制卡”架构,可以实现高精度轮廓跟踪控制。然而,此类运动控制器存在接线复杂、扩展性差、传输受限、互联性差等缺点,不能满足现代制造中的数据共享和智能制造要求。为解决上述问题,将以太网通信技术引入到多轴运动控制系统中成为主流发展方向。因此,研究网络环境下的轮廓跟踪控制问题具有很