基于Chrome Headless的网络爬虫在Web漏洞扫描中的应用研究

来源 :长安大学 | 被引量 : 0次 | 上传用户:k1165445191
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Web应用的迅速发展,Web网站的安全也成为人们共同关注的焦点问题。提升网站安全风险等级的首要任务就是找到网站上存在的漏洞,防止不法分子利用Web漏洞攻击网站,造成网站信息泄露和财产损失。其中,全站扫描就是Web漏洞扫描最前沿的任务,它可以帮助我们了解网站的目录结构、接口等相关信息,进而方便确定网站的操作系统、中间件以及数据库等相关版本和类型,有利于从中发现网站漏洞、架构缺陷等安全问题。而网络爬虫是一种可以根据人们需求自动爬取网页数据的程序,我们可以采用爬虫技术对网站上的所有链接进行采集从而达到全站扫描的目的。本文设计了一种面向Web漏洞扫描的基于Chrome Headless的网络爬虫,采用Chrome Headless配合Puppeteer提供接口来控制爬虫功能,以实现对目标站点的全站爬取,尽可能多地获取子站点的URL,通过精准的去重和搜索算法,在节约资源消耗的前提下高效地完成爬取任务。其次,对于目标站点中的外部链接进行检测和屏蔽,防止爬虫进入公网或者外域进行爬取,避免安全访问纷争与带宽占用。对于Java Script站点,以事件为驱动,利用Chrome Headless页面所有JS进行模拟运行,在事件模拟过程中,对弹出的窗口链接、跳转链接、对加载完成后的页面进行分析和爬取,从而避免很多漏爬行为。本文的主要工作如下。1.研究Chrome Headless与Puppeteer接口控制爬虫爬取URL、完成对JS的模拟运行、模拟正常用户登陆动作。2.研究页面解析方法来获取链接,对采集到的链接进行同源处理和重构处理,方便分析网站的结构。3.研究搜索遍历算法,对漏爬、外链、重复爬取问题作以规避。4.针对采集到的URL进行漏洞检测,生成检测结果。通过实验测试,表明本文设计的爬虫可以高效爬取指定网站的全部链接,支持复杂站点的扫描,可以分析出网站的目录结构,并针对爬取的URL进行漏洞检测。对Web安全维护和Web漏洞扫描具有较高的实用价值。
其他文献
本论文以德国剧作家莱辛(1729-1781)的剧作《明娜·封·巴尔恩赫尔姆》和《智者纳坦》的文本为依据,分析莱辛的人道主义思想在上述两部剧作中的体现,并探究作者在两部剧作中
装配式混凝土结构是一种以预制构件作为主要受力构件,经组装而成的混凝土结构形式,采用此种结构形式可有效缩短施工周期,且具有一定的环保功效。当前国内装配式混凝土工程多在基础以上二~三层处设置转换层,从而把施工分成两部分:转换层以下为现浇部分,转换层以上为预制部分。这种做法的优势在于可保证底部耗能能力强于上部,但缺点也较明显:不仅拖慢了施工周期,还降低了结构装配率,使装配式结构名不符实。基此,本文拟开展
非政府组织遍布世界各地,它们在所在地区的社会经济发展中发挥着重要作用,举世闻名。非政府组织支持政府在政府无法接触到的情况下,向人民提供特殊需要和服务。尽管非政府组
目的:糖尿病曾经被认为是西方和富裕阶层的疾病,现在糖尿病已全球流行化,2型糖尿病合并非酒精性脂肪性肝病的检出率也越来越高。通过检测正常对照组、2型糖尿病组、非酒精性
改革开放以来,中国经济取得了举世瞩目的成绩。中国早已成为了世界第二大经济体,2016年全年,国内生产总值达744127亿元。但与此同时,由于世界经济复苏缓慢,高投资驱动的不可
我们所处的时代已经变成了一个寻根的时代。在过去的一两个世纪里,人类目光所及之处已经完成或正在经历着大大小小的崩塌,上至民族国家、社群、宗教,下至种族、性别、阶级和
改革开放至今,我国农村经济在经过几轮制度变革后获得了较快发展,但部分农村地区尚未真正从贫困中“脱身”。为了改变这一现状,政府通过扶贫开发活动来减少贫困人口数量,降低贫困发生率,并实现了扶贫方式的转型升级,即从一开始的“输血式扶贫”向“开发式与输血式”并重的扶贫方式转变。我国精准扶贫战略的发展方向是帮助贫困户切实提升创收能力,从而改善生活水平的开发式扶贫为主,社会保障为辅,而产业扶贫作为开发式扶贫的
Weyl半金属作为一种新兴的自旋电子学材料,导电性与绝缘性并存,因此具有广泛的应用前景,研究进展迅速。REAlGe作为一类新型的Weyl半金属,同时具有Ⅰ型和Ⅱ型Weyl半金属的特征,因此成为自旋电子学材料的一大研究热点。本文所研究的合金化合物为REAlX(RE=Nd,Sm;X=Ge,Si),含有稀土元素、半导体元素以及ⅢA族元素Al,通过REAlX(RE=Nd,Sm;X=Ge,Si)合金化合物的
本文采用3D金属打印技术制作了一种新型金属规整填料(DP-1规整填料),并对这种新型金属规整填料进行了流体力学和传质实验。实验结果表明:DP-1规整填料的压降和持液量随气体动能F因子以及喷淋密度的增大而增大,泛点气速随喷淋密度的增大而减小,与传统填料相比,DP-1规整填料压降大,泛点气速小,操作弹性小;当F因子≤0.2 m·s-1·(kg·m-3)0.5,DP-1规整填料的传质性能高于750Y,当
随着我国高压直流输电的快速发展,各回直流不可避免地落点于同一受端电网,从而形成多馈入直流(MIDC)输电系统。MIDC系统可以提高电网运行方式的灵活性和扩大输送能量,然而由于MIDC系统中各直流逆变站之间电气耦合紧密,致使交直流系统的谐波相互作用错综复杂。上海电网是典型的多馈入直流受端电网,共有4回直流馈入,同时该电网中电缆线路占比不断增加、电压等级愈来愈高、负荷种类较多且电力电子设备及冲击性负荷