基于分类器集成的网页恶意代码检测研究

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:skyaixiao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在这个互联网飞速发展的时代,网络不仅丰富了人们娱乐生活,也在各个方面为人们做出了巨大贡献,改进了人们的生活。然而,网络在为人们的生活带来便捷的同时也带来了隐患。不法分子在网络的飞速发展中看到了可乘之机,利用恶意代码破坏网络安全,谋取经济利益。政府和国家对于恶意代码检测越来越重视。恶意代码检测一般分为静态检测和动态检测两种方法。静态检测[1]主要是基于规则和特征值匹配,提取网页特征。动态检测[2]是通过在虚拟环境中运行恶意代码,根据恶意代码的行为提取特征,本文主要是针对JavaScript恶意代码[3],基于机器学习对恶意代码检测进行研究。本文的主要工作和成果如下:1.本文对于混淆的JavaScript代码用V8引擎编译成机器码[4],并针对恶意代码特点将机器码中的操作数分类简化并与操作码混合。对处理后的机器码根据信息增益用Bi-Gram和Tri-Gram提取特征值。提出基于频率、距离和互信息的方法对样本处理找出断点,计算单个样本变长N-gram特征。经实验分析证实,处理后的操作数和操作码混合的特征提取能更细致的表达机器码行为,并且通过变长N-Gram统计的特征能避免将有效序列分开的问题,提升了分类效果。2.在研究常见的分类算法和分类器集成算法的基础上,针对输入单一的问题,提出集成分类器输入优化[5],对输入的数据集用不同方式处理,使得内部多种分类器能针对性训练形成分类模型进行集成[6]。并且通过加入次级分类器,将原本单层的分类器集成结构变成多层次分类器集成,引入权重,给每个分类器设定不同的权重,通过训练,找出效果最好的权值分配。实验证明经过多种优化的多层次加权分类器集成有更好的分类效果。3.在以上算法研究的基础上,设计并开发了在线恶意代码检测系统。用户可以在线提交恶意脚本代码或者网站地址,系统可以快速的进行检测。用户可以提交检测报告和查看别人提交的检测报告。被系统检测为恶意的代码,系统会自动保存到数据库。
其他文献
分析和排查甲烷化炉出口水冷却器换热能力不足的问题,确认为设备内部短路所致。经过改造,恢复了正常换热能力,为处理换热器类似故障提供了分析思路和借鉴。
随着我国经济的飞速发展,工业化、城市化进程的不断加快,对水资源也提出了更高的要求,但随之而来的污水排放增加问题也成为了一种趋势,对我国水资源的长期性、稳定性以及健康
海底科学长期观测网可针对海洋物理、化学、地质、生物、声学及其相互关系开展长时间、系列的精细变化观测,广泛应用于全球变化、海底过程、海陆相互作用以及海洋生态环境变
<正>初、高中地理课程存在着深度广度、教法学法等方面的差异,加上学生初中地理基础知识薄弱等多种原因,使高中地理成为难教、难学的学科。因此,在高中阶段,实现初高中地理教
南方电网公司天生桥换流站500 kV联络变压器的(下简称"联变")主保护采用国电南京自动化公司的PST-1200主变压器保护装置。该保护装置中配置的分侧差动保护功能在500 kV联络变
目的探讨止血带可逆性阻断子宫动脉上行支在腹腔镜子宫肌瘤剔除术中的临床效果。方法 2007年1月至2013年6月沈阳医学院附属第二医院将70例子宫肌壁间肌瘤患者随机分为观察组(
以敬民之心,行简政之道;革烦苛之弊,开便利之门。$$全国公安机关深化“放管服”改革电视电话会议7月2日召开。会议强调,要“突出问题导向、锐意改革创新,按照高质量发展要求和优化
报纸
当前新一轮课程改革以学生的发展为本,注重培养学生的创新精神和实践能力,注重学生全面素质的提高。同时,在课程的设置上,体现多样性、多视角、多形式地为学生学习历史提供更
通过对碧溪河现状的调查分析,提出以推进生态文明建设,发展绿色GDP为导向,充分利用流域的自然社会特点,因地制宜,准确定位发展主导产业,综合治理、推行“河长制”,从根源上改
电力通信综合网管系统主要是以光纤为主导,相关人员在了解电力通信综合网管的运用基本情况之上对使用主体管理网络的相关要求进行系统全面的整理、分析。经过分析后,电力综合