论文部分内容阅读
随着国内电子商务业务的快速发展,网络钓鱼对互联网金融以及支付领域的威胁不断增加,网络钓鱼检测技术日益受到安全人员的关注。现有对钓鱼网页的识别主要是依靠用户举报和黑白名单过滤机制完成的,目前的钓鱼网页识别技术还存在很多不足之处,本文主要针对现有技术中的不足加以改进,设计并完成一个更加完善的钓鱼网页识别系统。首先介绍网络钓鱼攻击的危害以及现有针对网络钓鱼的防范技术,通过对网络钓鱼案例的具体分析,细致地总结网络钓鱼攻击的主要特点和具体流程。然后介绍现有的网络钓鱼检测技术的具体实现过程,并分析其不足之处。针对现有的检测方法的不足,借鉴后向选择算法的思想,在信息获取、网站特征提取、分类器训练以及对疑似网络钓鱼网页的检测等过程加以优化,提出了基于RFE-SVM算法的针对钓鱼网页检测的思路,并设计了一种改进的钓鱼网页识别方法,以实现更高效、更准确、更有针对性的检测。论文主要从钓鱼网站URL的特征和页面特征综合考虑,通过仔细对比钓鱼网站与合法网站的属性特征,从网站的URL及Web页面中提取特征参数,用特征函数表示每一维特征分量,结合SVM分类器的分类输出权重参数对特征子集进行选择,在不影响分类效果的前提下,消除不重要特征,降低特征向量的维度,提高分类效率。最后使用大量的合法网站以及钓鱼网站进行检测实验,并对实验数据进行了详细的分析和比较,总结影响实验结果的各种因素。实验结果表明,改进后的钓鱼网页识别方法在一定程度上提高了对钓鱼网页的识别率,并具有较好的推广能力。