基于特征选择和增强训练的朴素贝叶斯网络钓鱼检测

来源 :安徽大学 | 被引量 : 0次 | 上传用户:lyysnnu
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着通讯行业相关技术的飞速发展和网络的普及,人们日常产生的数据量越来越大。如何从中提取出有用信息的需求越来越大,近年来,数据挖掘技术受到了研究人员的广泛关注。这是一种从大量的数据中发现数据之间的关系,并找出隐藏在这些数据之后有用信息的技术。分类算法是其中的一个分支,它主要是通过算法设计分类器,并使用各种分类器将数据集中的数据项划分到某一固定的分类当中。贝叶斯算法是一个利用概率统计为基础的经典的分类算法,因其使用方法简单、分类准确度高、速度快被广泛的研究与使用。贝叶斯算法主要有朴素贝叶斯算法和树增强型朴素贝叶斯算法,本文主要针对朴素贝叶斯算法进行了相关研究。(1)本文结合了信息熵的概念,提出了一种利用信息增益来进行特征选择的数据预处理方法,通过该方法可以选出更具有价值的特征来构建模型,便于通过调整提升分类器预测的正确率。同时,因为选取了较少的特征,分类模型的训练效率也会提高,减少训练模型所需的时间。(2)本文针对数据集训练方式提出了一种增强训练方法,将训练集切片,利用一段数据训练后对下一段进行预测,针对预测错误的数据项调整训练内容。通过这种方法可以使用更少的数据项与更快的速度来训练分类器。在此基础上本文提出了一种基于特征选择与增强训练的朴素贝叶斯分类器的钓鱼网站检测系统FSRT-NB(Feature Selection and Reinforcement Training-Naive Bayesian)。经实验证明,FSRT-NB分类器有着很好的分类效果和效率。
其他文献
罗汉果样品经加HNO3后利用微波消解进行前处理,采用电感耦合等离子体质谱法(ICP-MS)直接测定试液中的Pb和As,并对ICP-MS工作参数进行了优化和选择。为校正响应信号的变化及消除
埃尔金以“不当步骤”和“正确物”思想改造传统建构主义,并通过解释名称指称为之作出系统辩护。她强调诠释和理解在解释语言-世界之间关系中的作用,以此批判主流名称指称理论,
<正>车流中那一抹"蓝天白云"是许多人梦寐以求的,与其说宝马是一位造梦先生,还不如说是梦想造就了宝马。回望宝马百年发展史,便可发现,它的每一步、每一款产品、每一次技术革
张君劢是中国近代重要的哲学家和政治活动家。他一生经历丰富、涉猎广泛、思想深刻、影响颇大。1923年,张君劢与丁文江发起著名的“科玄之战”。在论战中,张君劢就科学与人文
我国现已确定进入保护范畴的传统村落为4153个。它们是我国数千年农耕文明史最重要的历史文化遗存,有着深厚的传统内涵,并保持着活态的文化传承。从精神价值看,它是中华文化重要
报纸
目的探讨便携式睡眠监测仪(PM)在儿童阻塞性睡眠呼吸暂停低通气综合征(obstructive sleep apnea hypopnea syndrome,OSAHS)中的诊断价值。方法随机选择门诊收治的58例以睡眠
转基因技术及其应用的高速发展与普通社会公众对其认知的匮乏,已经成为当前转基因农作物在中国科学传播的主要矛盾。本文结合世界转基因农作物的发展现状及其在中国的科学传
丝绸衣物上有大片霉斑,可将衣物平铺在桌子上,用喷雾器将稀氨水喷洒在霉迹上,过几分钟,霉迹便可消失。衣服上有酱油渍、醋渍,可先用氨水擦洗,然后用少量草酸液洗擦,最后用清
经过了长达几个世纪漫长的孕育过程,小说《水浒传》终于在元末明初问世。至《水浒传》的成书,水浒故事的演变大体经过了四个主要阶段。
采用湿法消解-原子荧光光谱法测定雪菜和土壤中的铅含量,并对实验条件进行了优化。采用优化的检测方法对公路旁、化工区的土壤及雪菜样品进行测定,结果表明种植环境中铅含量