基于爬虫技术的Web应用程序漏洞检测方法

来源 :北京工业大学 | 被引量 : 9次 | 上传用户:xiangjin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web2.0时代的到来,Web技术高速发展,网站渐渐由原本的静态文档发展成为具有各种强大功能的动态页面。互联网用户可以通过网站轻松的完成很多业务。然而由于大量的个人信息暴露在互联网上,随之带来的安全问题也逐年增加,跨站脚本攻击就是众多安全问题中的一个。在OWASP 2015中国应用安全论坛会议中,跨站脚本攻击仍严重威胁着Web应用程序的安全。针对跨站脚本攻击带来的严重危害,国内外安全研究人员提出了包括黑盒测试和白盒测试的检测方法,使得这一问题的危害得到了一定程度上的缓解。但是随着Web技术的更新,Web支持的功能不断扩展,跨站脚本的攻击者不断的发现可以绕过安全监测过滤的方法。针对以上问题,论文提出一种基于爬虫技术的Web应用程序漏洞检测方法,改进爬虫爬取网页、解析页面的方法,并且研究了漏洞挖掘策略,从而解决了网页爬取的效率以及网页分析的性能问题,提高了对漏洞检测的检测率,降低了漏洞的漏报率和误报率,并对其做了实验分析,结果证明研究方案具有良好的性能和准确性。论文主要工作如下:(1)研究了系统漏洞的成因以及当前主要的漏洞挖掘技术,分析了跨站脚本攻击的主要手段、检测方法以及研究现状,同时对当前主要的开源爬虫框架也进行了深入的学习和借鉴(2)针对目前开源的的某些爬虫技术存在爬取效率低、网页分析能力差的缺点,通过对Scrapy框架的研究,分析了页面爬取以及解析的具体过程,研究了URL的搜索和相似性去重,设计和实现了基于Scrapy框架的爬虫Libra,解决了系统爬取页面的效率以及解析页面的性能问题。(3)针对目前的跨站脚本攻击检测方法存在攻击代码单一、存储在数据库中笨重等缺点,以基本跨站脚本攻击代码为基础,根据不同类型的攻击方式,按照挖掘策略对攻击代码进行变形,输出了更加全面的攻击代码,从而提高了跨站脚本攻击漏洞检测率,降低了漏报率和误报率。(4)实现了基于爬虫技术的Web应用程序漏洞检测方法,对该方法进行了测试,并对测试结果进行了分析。
其他文献
随着数字音乐的快速发展,用户需要更丰富的音乐库管理手段和更高质量的音乐服务。情感作为音乐的一个重要表现部分,是音乐检索和音乐推荐的重要媒介,因此歌曲情感识别成为音乐检
计算机应用技术是一门研究在不同情况下,使计算机高效地为不同的需求提供可靠运算服务的学科。机器人作为一个软硬件高度集成的智能化系统,为计算机技术提供了广阔的应用平台。
近年来,随着互联网的飞速发展,Web应用越来越丰富,网上购物、社交网站等Web应用在现实生活中使用的更加广泛。但另一方面,Web安全问题也不断出现,越来越多的网络攻击发生在我
人脸识别是生物特征识别领域的一大研究热点。人脸识别技术具有自然性与不易被觉察等优点,因而受到人们的普遍欢迎,在国家安全、军事、公共安全等领域都有着广泛的应用前景。随
需求工程是软件开发中的一个重要阶段。作为需求工程的开端,需求获取所输出制品的质量将直接影响需求工程甚至整个软件开发过程的实施质量。现有的需求工程方法和实践中,有两个
随着微电子技术、无线通信及网络技术的进步,无线传感器网络技术与应用得到快速发展,极大地影响和改变人们的生活方式和产业结构,其广泛的应用前景受到学术界和工业界的高度关注
作为一种结构化数据检索的重要工具,Distributed Hash Table(DHT)受到大规模分布式系统的广泛应用,比如分布式存储、即时通讯。近几年,随着分布式系统规模的日益增大和激烈的行
近年来,云计算作为一种新型的计算范型,发展越来越迅速,规模也越来越大。然而,人们对于云计算安全性方面的担忧也越来越成为阻碍云计算发展的主要障碍之一。云环境高度复杂和多变
隐写术是信息隐藏领域用来秘密传递消息的一种技术,嵌入效率更高的隐写算法具有更好的安全性,而矩阵嵌入是一种用来提高隐写算法嵌入效率的有效方法。在进行矩阵嵌入前,通信双方
文本是存储和交换信息的最自然的方式,但是,随着信息时代的高速发展,文本的数量呈指数级增长,因此,如何迅速的从海量文本中获取信息就成为了一个具有挑战性的问题。  文本分类技