基于机器学习的恶意脚本代码检测方法的研究与实现

来源 :浙江工业大学 | 被引量 : 0次 | 上传用户:icerjack
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网富媒体应用的快速发展,网页恶意脚本的传播速度不断加快,其种类也日益增多。随着脚本压缩和混淆加密等技术的兴起,恶意脚本检测的难度逐渐提高,严重威胁了互联网应用安全。目前的恶意代码检测主要分为静态检测和动态检测两种方法。静态检测是针对恶意代码的文本特征进行分析,特征需由专家对已知恶意代码分析得到,具有识别快、准确率高等优势,但是无法识别未知恶意代码。动态检测是为恶意代码建立一个虚拟运行环境,根据运行情况识别恶意行为,能有效识别新的恶意代码,但是检测效率较低。本文专门针对JavaScript脚本,结合静态的脚本文本分析和动态的脚本机器码提取分析,应用机器学习算法进行研究,取得以下几方面成果:1.提出了简单、快速识别混淆脚本的方法。一些恶意的JavaScript脚本利用混淆技术来隐藏自身特征,躲避以检测规则为基础的或以正则表达式为基础的杀毒软件的检测。对于混淆的脚本,目前还没有成熟的自动检测工具。本文在研究各类脚本混淆方法的基础上,采用N-gram方法,对脚本进行特征提取,使用K-最邻近(KNN)分类算法进行训练,能有效识别混淆脚本和非混淆脚本。检测脚本的混淆性对检测恶意脚本工作具有重要作用。2.提出了检测混淆恶意脚本的方法。对于混淆的JavaScript脚本,其文本特征已被隐藏,难以用静态方法分析。本文使用V8引擎对混淆脚本动态编译,自动获取脚本执行的机器码,通过对机器码中Call序列的N-gram特征提取,再结合KNN方法进行分类训练,经实验分析证实,能有效识别混淆脚本是否恶意。3.提出了检测未混淆恶意脚本的方法。使用静态方法分析JavaScript脚本特征,包括一些特征函数、系统对象调用、信息熵统计等,先获取脚本的特征向量,再使用支持向量机(SVM)机器学习算法,进行样本训练并建立优化的预测模型,经实验分析证实,能有效识别未混淆脚本是否恶意。4.设计开发了一套基于Web的综合的恶意脚本代码检测原型系统,可在线快速检测JavaScript脚本是否混淆以及是否包含恶意代码。
其他文献
随着物联网技术的不断发展,作为传感技术、计算机技术以及通信技术融合与革新的产物,物联网必将掀起世界信息通信技术产业的第三次浪潮。本课题以此为背景,结合在众多行业内
目的:对于非巨大卵巢良性肿瘤行腹腔镜治疗已成为卵巢肿瘤手术的首选术式,但术中肿瘤易破裂,内容物溢出后导致化学性腹膜炎及腹腔肉芽肿形成,尤其是卵巢粘液性囊腺瘤,囊瘤穿破
随着对药品质量监管力度的不断加大和法规的不断完善,如何保证药品质量和生产符合GMP (Good Manufacture Practices,药品生产质量管理规范)是制药企业必须面对的一个问题。随
<正> 早在建国初期,著名建筑师梁思成教授就提出中国建筑的最高审美标准:"中而新"。此一标准得到建筑界的一致赞同,至今仍为一些人常常提及。"中而新"为何如此有生命力呢?我
我国建筑节能工作的开展,从最初的主要在北方地区开展建筑节能,到建筑节能工作在全国范围逐步展开,再到目前进入建筑节能全面启动阶段。当前,我国建筑节能管理制度尚存在一些问题
随着城市化进程的加快和汽车工业的发展,现有城市道路的通行能力与不断增长的交通需求之间的矛盾变得日益尖锐,交通拥堵现象日益突出。应用智能交通系统对交通流进行有效地控
二甲戊乐灵(Pendimethalin)是广谱高效的二硝基苯胺类选择性除草剂,在环境中的降解主要是生物降解和光降解。国内外有关于二甲戊乐灵降解微生物的报道,但降解效率都有待提高。
苏教版高中语文必修教材外国文学作品的选文质量的高低直接影响到外国文学作品的教学效果,而这一效果又牵连着学生的学习兴趣与热情。在新课程改革的背景下,苏教版高中语文必修
针对提高大规模信息内容的搜索效率,非结构对等网络(Peer-to-Peer, P2P)技术成为占主导地位的关键技术。但由于网络规模和信息内容的不断增大,使得全局网络信息的获取变得十
对虾白斑综合症病毒(White spot syndrome virus, WSSV)是线形病毒科(Nimaviridae)白斑病毒属(Whispovirus)的唯一成员,是一种非包涵体的类杆状病毒,具有双链环状DNA,能感染对虾、螯