【摘 要】
:
互联网的快速发展,随之带来的网络安全问题也越发严重。网络钓鱼作为窃取用户个人信息的诈骗技术之一,十分严峻。目前,提高网络用户的安全用网意识和增强安全用网技术,成为网络安全领域研究的重点之一。当下,基于URLs特征的钓鱼检测技术主要有机器学习方法和深度学习方法。因为传统的机器学习方法比较依赖于特征的挖掘,但比较耗时且依赖于领域知识。所以,有学者用深度学习模型研究钓鱼检测问题。因为深度学习方法避免了基
论文部分内容阅读
互联网的快速发展,随之带来的网络安全问题也越发严重。网络钓鱼作为窃取用户个人信息的诈骗技术之一,十分严峻。目前,提高网络用户的安全用网意识和增强安全用网技术,成为网络安全领域研究的重点之一。当下,基于URLs特征的钓鱼检测技术主要有机器学习方法和深度学习方法。因为传统的机器学习方法比较依赖于特征的挖掘,但比较耗时且依赖于领域知识。所以,有学者用深度学习模型研究钓鱼检测问题。因为深度学习方法避免了基于URLs构建传统特征的工作,利用模型优势自动挖掘潜在特征,且在识别钓鱼网站方面有很大的提升。本文的研究,考虑了深度学习方法提取特征的优势,和传统机器学习模型的检测能力,提出基于深度学习挖掘特征的机器学习检测模型。简单描述,利用深度学习模型的复杂性,从URLs字符串中提取更多的特征;但避开深度学习最后一层比较简单的分类检测模式,而是选择用传统机器学习模型中的非线性分类方法或集成模型进行钓鱼网站的分类检测。这样,既利用了深度学习方法的挖掘特征能力,又能结合机器学习模型的分类能力。然后根据此方法,本文主要包含三方面的实验内容:一,从URLs字符串的角度出发,考虑选择的深度学习方法。因此,本文选择了LSTM、BiGRU和BiGRU-Attention模型,进行介绍它们在表示URLs字符串的差异和效果。二,用前面模型中最好的BiGRU-Attention提取URLs字符串的特征,然后与基于URLs的传统特征及两者的组合特征训练传统机器学习方法SVM、Random Forest和XGBoost模型,比较不同特征带来的差异。三,用不同时间段和来源的网址数据集,分析数据集差异带来的钓鱼检测效果差异。最后,得到了基于BiGRU-Attention模型提取特征,用XGBoost作为分类的一种融合检测模型。并在多个数据集的验证下,在几种模型的对比中效果最好。
其他文献
飞机板件疲劳裂纹扩展试验对飞机受力后的状态分析具有重要的指导意义,同时该试验还能为飞机结构方案设计提供详细的测试数据。本文针对飞机板件疲劳裂纹扩展试验中,裂纹测量与裂纹扩展曲线绘制的需求,设计并研发了基于机器视觉的飞机板件裂纹测量系统。主要工作如下:(1)介绍飞机板件疲劳裂纹测量现状并分析国内外学者的研究成果。针对目前人工测量的不足,说明采用机器视觉技术测量飞机板件裂纹的必要性,同时对裂纹测量的主
通过对89种古医籍的检索,收集符合纳入标准的针灸类条文98条,对其中涉及治则治法及治疗方术内容的条文进行文献辨析、信息提取和统计分析,总结了古代针灸治疗皮肤瘙痒的取穴
【正】 一、两个极端每当提到彼得·德拉克的大名时,企业界许多人就会竖耳恭听起来。多年来,有关企业方面的问题几乎很少不曾引起德拉克的兴趣,而陈放在六呎书架上的既有
本文作者从变频器的历史发展、基本原理及主要特点入手,并结合印刷机械行业的现状,分析得出变频器在印刷机械乃至其他行业应用上将成为一种历史必然的趋势。
谷子是我国北方重要的粮食作物,具有较高的营养价值。但谷田杂草严重影响了谷子的生长发育,甚至引起谷子减产、绝收。苄嘧磺隆和吡嘧磺隆均是一种超高效的磺酰脲类除草剂,但
地质遗迹是自然界创造的不可再生和珍贵的自然遗迹之一。一般来说,地质遗迹资源是地质环境空间的主要构成,是人类生存不可或缺的一部分。它是人类观察地球本身和地球环境演变
为了解决小汽车交通带来的交通拥堵、环境污染、能源消耗等一系列社会问题,世界各国都在大力发展城市轨道交通。轨道交通系统的迅速发展使其成为城市的骨架,轨道交通站点可以作为研究城市问题的探针。本论文定义通过轨道交通到达其站点周边地区的乘客的活动目的为站点功能,例如居住、工作、餐饮和休闲等。轨道交通站点功能的变化,如工作功能增强或居住功能减弱,为站点功能的演化。在轨道交通系统实际运营过程中,存在着与周边土
中国卤虫(Artemia sinica)是一种生活在高盐水体中的小型甲壳动物,是重要的水产饵料生物,具有极强抗逆能力,也是分子生物学和发育生物学研究的重要实验动物,在胚胎学和分子生