基于关联关系的非法域名及其组织挖掘方法的研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:ximage
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
域名作为互联网关键基础资源之一,网站建设、邮件服务等均依赖于域名。由于域名的重要性和广泛应用,其经常被攻击者用于网络钓鱼、网络博彩、传播淫秽色情等非法用途。本文将这些被用于非法用途的域名称为非法域名。减轻非法域名危害的首要方法是及时发现并对其进行管控,因此,如何挖掘非法域名及其组织成为当前的研究热点,并且具有重要的理论意义和研究价值。非法域名挖掘包括非法域名发现和非法域名检测两部分工作,其中发现工作是根据已有非法域名发现未知域名空间中疑似非法的域名,而检测工作是对已发现域名的非法性进行验证。本文根据非法域名在网站、DNS(域名系统)、域名WHOIS以及域名构造等多元信息上的关联关系,提出了基于名称相似的非法域名生成算法和基于关联关系的非法域名检测算法,分别实现了非法域名发现和非法域名检测工作,并设计实现了非法域名及其组织挖掘系统,挖掘出具有关联性、多种类型的非法域名并发现其组织。本文主要研究内容如下:首先,本文提出了基于名称相似的非法域名生成算法。该算法通过小批量K均值算法从已有非法域名集合中得到名称相似的非法域名簇集,以此作为训练集,训练本文设计的基于域名名称相似的序列对抗生成网络,进而通过训练好的生成网络生成多种类型的新非法域名。其次,本文提出了基于关联关系的非法域名检测算法。根据域名在多元信息上的关联关系构建以域名为顶点、关联关系为边、综合关联度为边权重的加权无向图;通过并行化的Louvain算法对该加权无向图进行划分,得到多个具有组织结构的子图;根据子图中标签信息的情况分别采取相应的策略处理,特别地,对于含有合法和非法标签的子图,采用局部全局一致性学习算法预测子图中未标记域名顶点的标签,从而检测出非法域名,发现非法域名组织。最后,本文设计并实现了非法域名及其组织挖掘系统。该系统包括收集权威第三方发布的黑名单的收集模块、主动获取未知域名空间中非法域名的三种获取模块以及验证所获取域名的非法性,并从中发现非法域名组织的非法域名验证与组织发现模块。通过实验表明,本文设计与实现的算法和系统满足研究目标,可挖掘出大量的非法域名及其组织。
其他文献
<正>农业再保险制度是农业保险发展中的重要一环,完善的农业再保险制度是农业保险稳健发展的保障。国外有较为成熟的农业保险体系,能够熟练地运用再保险分散风险。学习国外农
在美国广告营销界一直流传着这样一句名言:“我知道在广告上的投资有一半是无用的,但问题是我不知道是哪一半。”广告作为现代企业的重要的营销手段,其效果评估一直是营销界
近年来,随着全球性宏观经济形势的波动,各国物价水平呈现出持续走弱或高涨的情况。这一经济现象使得学术界更为集中地关注了物价波动中外部冲击的作用。本文从物价波动中的来
研究了从药食两用植物栀子中提取熊果酸的工艺,通过单因素实验和正交实验及方差分析,结果表明:在85.4℃水浴中,以90%乙醇水溶液为提取液,液固比15:1,回流提取2次,每次提取2.5h,熊果酸的浸
音乐教育的非音乐性是指在音乐教学中违背音乐的本质特征,忽略和淡化音乐的根本价值功能,湮没了音乐教育的教学规律和学科特点的现象。这些问题的产生源自于片面理解音乐的本质
中外对私有财产刑法保护在立法模式、保护对象及保护手段等方面均存在一定差异,我国现行刑法对私有财产保护尚有不足之处.在我国刑法中宜将无体物、财产性利益的保护作出明文
<正> 汪奠基先生(1900~1979)原名三辅,号芟芜、山父等。湖北鄂城人。他是我国现代知名的逻辑学家。汪奠基先生是最早著书向国内传播现代逻辑的中国学者之一早在1927年,年轻的
综合考虑品牌延伸各要素功能和属性的相互联系和制约,对涉及品牌延伸的众多财务指标和非财务指标进行综合分析和评价,从而通过品牌延伸有效性评价指标体系,将DEA方法引入到品
目的:为控制巴中栀子的质量,建立高效液相色谱法测定巴中栀子中熊果酸含量的方法。方法:采用高效液相色谱法,以熊果酸为化学对照品,固定相:Ultimate^TM C.8键舍硅胶柱(4.6mm&#215;250m
铅锌尾矿养分含量低下、物理结构差、重金属含量高以及重金属复合污染等因素已构成金属矿区生态修复的重要难题。针对铅锌尾矿污染的特点,介绍了几种主要的铅锌尾矿修复技术: