基于模糊关联分类的钓鱼网站检测方法研究

来源 :东北师范大学 | 被引量 : 3次 | 上传用户:wuzhihot9
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着因特网的发展,网上出现了越来越多的犯罪行为。网络钓鱼就是其中最常见的一种犯罪行为。钓鱼网站通过技术手段模仿著名的网站,诱使用户访问,盗取用户信息和金融账户,使用户蒙受损失。网络钓鱼的出现对互联网的发展以及网民的人身和财产安全都产生了巨大的危害。于是研究钓鱼网站的检测方法有着重要的现实意义。本文在国内外学者提出的钓鱼网站检测方法的基础上,使用特征选择和模糊关联分类结合的方法,对钓鱼网站检测方法进行了研究。针对网络钓鱼检测方法提取的钓鱼特征中包含大量的不相关和冗余特征这一问题,本文提出基于LVF和CFS结合的特征选择算法-LVCFS算法,首先从待测页面获得URL特征和Web页面特征,由于LVF的设计过程中只考虑了钓鱼特征与类别的相关性,而没有考虑特征与特征之间的关联程度,因此LVF算法不能有效去除钓鱼特征中的冗余特征,所选出来的特征中会存在一些冗余,使用CFS算法除去冗余特征。LVCFS算法融合了LVF算法和CFS算法的优点,能够较好地去除不相关和冗余。接着,针对钓鱼网站检测方面,现有的检测方法准确度较低,而且钓鱼特征中包含连续数值型特征时,还没有很好的检测方法,于是本文研究得到一种基于模糊关联分类的CFARWV算法。提出的CFARWV算法是由模糊关联分类算法CFAR改进得到,CFARWV算法将CFAR中使用的单一优胜法(single winner)模糊分类推理方法(FRM)改进为投票加权法(weighted vote),并且使用改进的权重代替置信度作为规则权重。对使用LVCFS算法进行特征选择后的特征向量进行学习,采用CFARWV分类算法训练CFARWV分类器,接着使用得到的CFARWV分类器进行分类,从而得出判定结果。最后对本文提出的LVCFS算法进行验证,与LVF、CFS、ReliefF算法进行对比实验。对CFARWV算法进行验证,与Ripper、CMAR、CPAR、CFAR关联分类算法进行对比实验,并且结合实验结论对未来的工作进行了展望。
其他文献
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield
【正】 随着经济体制改革的不断深入发展,我国企业正在从生产封闭型向经营开放型转化,企业对情报的需求从数量上急剧增加,在质量上不断提高,这就对企业情报工作提出了更高要
兔球虫是一种属于孢子虫纲球虫目的原虫,其种类较多,致病力和寄生部位也各异。据资料报道〔1〕,全世界已发现17种兔球虫,其中艾美耳属15个种,等孢属和隐孢子属各1个种。我国自1959年以来,北京
The government may respond to collective resistance with any modes of repression, tolerance or concession when the collective resistance occurs. It is the featu
<正> 引言科技图书是人类文化科学知识总结和积累的记录形式之一,是科技文献的重要组成部分,也是数量最大和最常见的文献。科技图书大部分是对已经发表的科研成果、生产技术
警察体能的强弱是衡量警察体质好坏的重要因素。提高体能、增强体质是提高警察战斗力的重要组成部分。但是随着国民经济的快速增长,生活水平得到了极大改善,科学技术快速发展
随着我国社会、经济和科学技术的不断发展,情报学理论研究已进入了一个新的发展时期。我国科技情报工作起步于本世纪五十年代中期,对情报学理论研究虽然作了大量工作,也取得
作者根据科技文献工作经费匮乏,书刊价大幅度上涨,文献订数锐减,文献利用率低又难以满足情报需求的严峻形势,提出要改变文献工作目前状况,应从文献工作本身入手。其中,更新观
作者利用控制论的原理分析了情报大系统的结构,功能和控制特性,研究了情报系统的基本控制方式和控制系统的性能,讨论了情报大系统的控制策略和机构设立。本文的论述对于情报
回 回 产卜爹仇贱回——回 日E回。”。回祖 一回“。回干 肉果幻中 N_。NH lP7-ewwe--一”$ MN。W;- __._——————》 砧叫]们羽 制作:陈恬’#陈川个美食 Back to yield