混淆网页木马检测技术的研究与实现

来源 :北京邮电大学 | 被引量 : 1次 | 上传用户:tzxyqzch
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
网络信息获取方式的多样性及普遍性使得脆弱的互联网终端成为不法攻击者通过网页木马静默攻击用户的主要途径。JavaScript语言不仅是构成互联网上活跃和动态Web内容的核心组件,同时也为大量进行偷渡式下载的网页木马提供了攻击和隐蔽自身的基础。由于这些攻击的混淆代码频繁而多变,给恶意代码检测的研究带来了困难,静态的检测方法在实践中被证明具有很大的漏报率,动态的行为检测方法的检测率受到恶意特征库的局限且开销大。本文深入分析与研究了混淆网页木马的技术与特点,然后提出了基于多字节码的恶意JavaScript检测模型,利用抽象语法树获取重构的代码,以此代码为基础提取多字节码特征,并利用高效的机器学习技术进行分类器模型的训练。最后设计与实现了基于多字节码的恶意代码检测系统,并验证了系统的有效性,进行系统展示与功能验证。论文的主要研究内容和成果如下:1.提出基于多字节码的网页木马特征提取方法。获取代码解析后的字节码表示,利用代码经过编译解析产生的语义泛化性,从中提取可以表征恶意JavaScript代码的多字节码特征。2.提出一个基于多字节码的混淆网页木马检测模型。首先将代码解析为抽象语法树,通过遍历树结构对语法树进行组织重构,使用转换后的语法树生成代码行为清晰的同语义代码。以经过重构的代码为分析基础,使用基于多字节码的特征提取技术,利用高效的机器学习技术进行分类器模型的训练。搭建测试环境,设计测试效果检测实验对提出的检测模型进行测试。3.设计与开发了基于多字节码的混淆网页木马检测系统,设计与实现系统各功能模块。该检测系统可利用离线训练得到的模型对网页数据进行网页木马检测。对模型的测试实验结果表明,基于多字节码的特征提取方法可以有效地提取出能够表征恶意代码的多字节码集合。模型结合了代码重构以及多字节码特征提取,能够自动化地获取有效的混淆网页木马特征。对系统进行的检测评估表明,本文提出的检测模型具有较好的泛化能力。
其他文献
职业自我效能感是自我效能感的衍生概念,对企业职工工作绩效等具有重要的影响,与职工日常工作存在紧密联系。职业自我效能感在个体职位甄别、员工工作行为等具有巨大的影响,
对国外特高压输电技术的研究进行了系统的分析;对特高压输电的必要性作了全面的论述;介绍了我国开展特高压输电技术研究的情况和条件.
舍伍德·安德森的代表作《小镇畸人》被誉为美国第一部真正意义上的现代小说。作为美国现代主义小说的先声,安德森的创作风格暗合了当时刚刚兴起的弗洛伊德精神分析.将笔触
党的十九大明确提出把党的政治建设摆在首位,充分发挥党的政治建设的统领作用。新中国成立70年来,中国共产党高度重视党的政治建设,始终把讲政治摆在党的建设的突出位置,在党
日前从2013年国际智能电网论坛上获悉,我国已经建立了系统的特高压与智能电网技术标准体系,编制相关国际标准19项,特高压交流电压已成为国际标准电压。
于2007年4月16日正式对外开放的成都金沙遗址博物馆,开馆两年多来,已接待来自各地的游客160万余人次。按照高标准、高起点设计制作的基本陈列《走进金沙》,也得到了各级领导与中
在新课改背景下,传统的教学模式已经无法满足学生的学习需求,因而教师需要及时调整并创新教学模式,以此激发学生学习兴趣,切实提高课堂教学效果。为此,本文主要以小学五年级
近来,首部中国IMAX动画电影《哪吒之魔童降世》上映第五天就突破国产动画电影内地票房纪录。不久前在北京故宫举办的“良渚与古代中国——玉器显示的五千年文明”展,也因该项目
报纸
德国是高等教育史上近代大学的发源地,也是19世纪世界高等教育的楷模,但两次世界大战使德国高等教育由强盛走向衰弱。德国联邦政府立足现实,坚持传统,并结合新时代需求,大力
利用生物质吸附去除水中重金属离子具有制备简单、成本低廉、环境影响小等优点,通过高锰酸钾-硫酸亚铁处理过程对铜绿微囊藻改性,制备了能够高效吸附水中锑(Sb)的铁锰改性藻粉