论文部分内容阅读
随着互联网技术的快速发展,钓鱼网站已经成为威胁到互联网稳定的因素.本次设计中,首先,以真实URL链接为基准,利用网络蜘蛛来抓取与此相似或相近的URL链接,作为疑似钓鱼网站;其次,通过LD算法对正确网站和疑似网页的HTML源码进行相似度比对,一旦相似度达到阈值,就认定可疑网站为钓鱼网站;最后,基于分析结果建立钓鱼网站的黑名单和白名单.经测试,该技术能够根据用户输入的URL自动进行钓鱼网站的检测,达到了预期的目标.