一种基于域名检测的反钓鱼系统的设计与实现

来源 :中国科学院研究生院 中国科学院大学 | 被引量 : 0次 | 上传用户:uxc
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络钓鱼(Phishing)是近几年来逐渐兴起的网络犯罪。它利用多种手段欺骗用户致使用户泄露个人隐私信息,影响了互联网经济的有序发展,破坏了互联网的信任环境。因此,打击网络钓鱼,对维护正常的网络秩序、重建网民对网络的信任具有重要的意义。   本文首先对网络钓鱼的常用手段进行了分类讨论,并对国内外现有的反钓鱼技术和产品情况进行了调研。然后以域名为研究目标,通过分析网络钓鱼与域名的关系,以及现有互联网络存在的安全隐患,提出了从域名出发检测网络钓鱼的可行性。基于以上研究,我们设计了一种基于域名检测的反钓鱼系统。该系统通过对注册域名的字面信息进行分析,对域名的仿冒可疑程度进行评估。系统的设计实现采用了Model-View-Controller设计模式,以达到系统模块间的松耦合。   国际化域名(International Domain Name,IDN)的兴起,使域名的空间得到了扩展,但也带来了IDN钓鱼欺骗。本文分别对英文域名仿冒情况和可能的中文域名仿冒情况进行了分析和探索。结合已有的对字符串比较算法和汉字建模的研究,作者分别设计了针对英文域名和中文域名的相似性评估算法。   本文设计的域名相似性检测算法分为两个层次:第一层次为单个字符的相似;第二层次为域名整串的相似。利用点阵重叠算法计算字符间的相似程度,并在此基础上改进了基于编辑距离的字符串比较算法。对于中文域名仿冒情况,单个汉字间的相似除了考虑点阵重叠外,还结合了汉字的拼音、字形等信息。   在实验中,本文以简体中文汉字的点阵字为研究对象,实现了汉字语音相似比较算法,汉字特征向量抽取算法和汉字字形相似性统计算法。最后,本文分析了目前已完成的工作,并且对下一步的研究方向进行了规划。   作者参与了整个方案的设计,实现了中文域名相似性的检测方法,并且完成了算法有效性的测试。
其他文献
个体活动链包含了个体活动的时间、位置、次序和活动目的等信息,是理解个体时空行为特征的重要基础。从时空角度理解和分析个体活动链能够为城市人口管理、城市规划、交通分析
随着数字技术和因特网的发展,图像、音频、视频等形式的多媒体数字作品纷纷在网络上发布,其版权保护与信息完整性保证逐渐成为迫切需要解决的一个重要问题。隐写技术作为信息
溶解氧是指溶解于水中分子状态的氧,是水生生物生存不可缺少的条件,也是水污染和水体富营养化监测时的一项重要指标,对水质监测、水产养殖业的发展、饮用水安全等都具有非常
学位
科研活动中存在大量文档形式的资料。支持e-Science的协同工作环境不仅要能实现常规的文档共享和管理,还需充分发挥在线协作的优势,能够对大量多种格式的文档进行即时在线浏览
信息技术的飞速发展给数据保护提出了越来越高的要求。传统的数据保护技术无法很好解决备份时间窗口、恢复时间窗口及恢复时间点粒度这三者之间的矛盾关系,持续数据保护(Cont
学位
跨文本命名实体同指是指出现在多个文本中的相同名字指称现实世界中的相同对象。同指消解则是判断相同的名字是否指称相同对象的过程。跨文本同指消解对于多文本摘要和信息融
学位
随着计算机网络和无线射频识别(RFID,Radio Frequency Identification)开环应用的普及,RFID搜索技术已经成为一个研究热点。由于RFID电子标签的容量十分有限,因此大量的RFID
在生物学当中,BLAST序列比对算法是一个应用极为广泛的算法,它对海量DNA或蛋白质序列进行处理,具有数据密集和IO密集型特征,消耗时间通常令人难以忍受。因而,通过并行化来提高BLAS
随着3G通信技术的成熟及3G网络的大规模建设,3G网络的“杀手级”应用-移动视频,正越来越受到人们的广泛关注。目前实现的多媒体服务器大部分采用的是SIP通信协议,而3G视频通
Web服务组装作为一种跨组织业务流程的实现形式,得到了广泛的关注。通过把多个功能单一的Web服务集成到一起,可以提供实现复杂业务逻辑的完整解决方案。WS-BPEL(Web Service Bus
学位