论文部分内容阅读
本文从应用层网关入手,采用处于用户态下的Winsock2SPI技术,拦截套接字函数,截获网络数据包。截获了网络封包之后,需要通过协议解析器对网络封包进行协议解析,协议解析模块首先需要对封包的协议类型进行判断,再根据封包的网络协议格式对网络封包进行处理,从中提取出所需要的信息。
在信息过滤处理的设计过程中,本文采用了地址库过滤和内容判别过滤相结合的方式。地址库过滤方式是将用户请求的IP或URL与不良地址库进行比对,阻断地址库中存在的不良站点。地址库过滤方式一般情况下会存在两个方面的问题:一是由于目前互联网的信息量巨大,造成地址库信息量的无限增长,使得信息搜索速度缓慢,因此,为了压缩不良信息库的容量和提高过滤系统的处理速度,必须有针对性地对网站进行IP、URL收集和过滤;二是由于网站更新速度快,以及不良网站的地址更新频繁,使得过滤过程中会漏掉很多需要过滤的内容,因此需要定期对地址库进行更新。内容判别过滤方式是对网络数据包中的内容进行过滤处理的方式。采用内容判别过滤方式,可以弥补地址库过滤方式的弱点,无需经常性地更新数据库。
为了将这两种方式有机地结合起来,本文所设计的系统在初始化时根据用户对系统的配置情况设置一个具有典型IP和URL的初始地址库(地址库的容量较小),当对网络封包进行过滤的时候,首先把从网络封包中提取出来的IP地址和URL信息与地址库中的数据进行比对,形成信息过滤的第一道屏障。然后,对通过了地址过滤的网络封包进行内容过滤,此处采用了向量空间模型来实现。如果在内容过滤的过程中,决定要滤掉某个数据包,则将此数据包的URL或IP地址记录到地址库中,在系统过滤过程中所增加的地址信息可让用户通过界面进行管理。实验证明,该方法实用有效,并取得预期的效果。