钓鱼网站检测方法及技术研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:bevanwq
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的快速发展促进了经济与社会的发展,网上购物、娱乐与社交等互联网新兴事物的迅速普及为民众的现代生活提供了极大的便利。但与此同时,网络环境的复杂性和信息系统的脆弱性也带来了一系列的安全问题,造成了巨大的负面影响。网络钓鱼是互联网安全的巨大威胁之一,已经造成了严重的社会影响及经济损失。网络钓鱼千变万化的形式、爆发式增长的态势,给检测方法提出了更高的要求。钓鱼网站是网络钓鱼实施诈骗的主要工具,研究有效的钓鱼网站检测技术,减少钓鱼网站给互联网用户带来的持续困扰,是一项重要而又紧迫的研究任务。  本论文以提高钓鱼网站检测的准确率为目标,研究互联网中钓鱼网站检测的相关方法与技术,包括:基于两步式投影寻踪的特征工程方法、基于混合特征的钓鱼网站表征方法与混合特征的融合方法。在此基础上,研究移动终端恶意软件APP的检测技术。本论文的主要贡献如下:  1.针对钓鱼网站的特征表征问题,提出了基于两步式投影寻踪的特征工程方法,用于构建钓鱼网站的检测模型,该方法可有效地提高钓鱼网站检测的准确率,并降低误报率。本文通过解析URL与HTML页面内容,提取特征向量。使用基于遗传算法的Wrapper方法,将特征划分为关键特征与非关键特征。对于非关键特征,没有简单地将其删除,而是提出两步式投影寻踪算法将其投影到一维特征空间中。最后,将新产生的特征结合关键特征,构建钓鱼网站的检测模型。  2.针对英、中文网站,提出了基于文本、URL和HTML混合特征的表征方法,并采用基于极限学习机的集成学习技术,构建钓鱼网站检测分类模型,有效地降低了检测漏报率。基于URL和HTML的方法对检测挂在合法网站域名下的钓鱼页面具有较高的漏报率,而基于页面文本的检测方法通常无法检测图片格式的钓鱼网站,进而产生漏报。因此,本文提出使用以上特征构成的混合特征,并结合基于极限学习机的集成学习技术构建分类模型,用于降低钓鱼网站检测的漏报率。  3.针对网站文本与URL和HTML的融合问题,提出了半特征级-半决策级融合的方法,用于构建有效的特征向量,提高检测的准确率。对于页面文本,首先计算其TF-IDF值,然后按照数值从大到小排序,将前N个词汇作为文本的关键词,建立决策模型,鉴别其类别标签,将此标签作为特征,与基于URL和HTML的特征进行混合,用于构建钓鱼网站检测模型。  4.针对移动终端恶意软件轻量级检测,提出了基于Fisher准则-遗传算法(Fisher-Genetic Algorithm,F-GA)的特征选择方法,成功应用于Android平台上的恶意软件APP检测。在移动互联网中,钓鱼网站的表现形式是移动恶意软件APP,可以采用移动恶意软件的检测技术。因此本文提出了基于Permission、API和Dalvik指令的混合特征,并结合F-GA特征选择算法,构建有效的特征向量,用于Android平台上恶意软件APP的检测。
其他文献
随着人类对于软件的使用越来越广泛普遍,研究越来越深入,对其精确度的要求也越来越高。程序的语法错误可以在相应的平台上完成检测,但是并没有完成程序逻辑检测。针对软件逻辑错
信息技术的进步和计算机软硬件技术的快速发展推动了计算机系统的大量普及。启动速度是衡量计算机系统性能和用户体验的重要指标之一。提升计算机系统启动速度具有重要意义。
矩阵是一种非常重要的基本数据结构,它在电子商务、社会网络、信息检索等领域都有广泛的应用。如今这些领域处理的数据量越来越大,而过去对矩阵运算的研究多集中在单机算法,用户
自动文本摘要通过计算机技术完成对文本的分析,并能够自动生成摘要以及实现对内容的总结,能够帮助用户尽快获取可用信息,并有利于用户对自身兴趣的定位。对自动文本摘要的研究,在
随着计算机计算能力的迅猛发展,计算机所能处理问题的规模越来越大,提高计算的可信性和高效性已成为工业界和科学界的共同目标.符号计算可以得到问题的精确结果,但计算复杂度高;
多媒体技术和互联网的高速发展促使图像视频信息爆炸式增长。随着多媒体处理技术的不断发展,视频技术正朝着超高清和立体的方向发展。在过去的二三十年间,视频编码技术得到了广
软件产品结构是软件工程领域的一个研究热点。在软件的再开发、缺陷修复、新人进入、遗产软件维护等开发活动中,了解软件的产品结构都可以帮助提高开发效率和产品质量。但是,在
在影视制作的过程中,制作影视特效的目的就是把电影中难以表达的场景,呈现给观众。或从降低成本的角度考虑,在降低了成本的同时又能给观众带来较好的观影感受。对于包含大量人群
头部姿势估计是一个典型而复杂的模式识别问题,在人脸识别、虹膜识别、视线估计等研究领域有着广泛的应用前景,具有重要的学术研究价值。本文以Kinect传感器获取的RGB-D图像为
螺旋焊管广泛的应用于各种有关国计民生的重要环节,主要是用于石油、天然气的输送管线。我国螺旋焊管机组整体水平与国际先进企业相比,在数字化及生产自动控制方面还存在较大差