Linux下基于内容过滤防火墙性能的改进

来源 :电子元器件应用 | 被引量 : 0次 | 上传用户:weiyuanbin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
  摘要:论文以Linux Netfilter第七层封包分析模块为基础,分析了此类防火墙在实际应用中存在的不足,通过改变L7-filter的封包处理方式有效地解决了封包误判的问题;并通过运用状态检测技术,来提升封包经过防火墙时处理的性能,使得在网络流量高或过滤规则多的情况,不会因为内容过滤机制速度过慢,而拖垮网络的整体性能,通过如上的改进,使得内容过滤机制具有更大应用价值。
  关键词:防火墙;封包识别;内容过滤;连线跟踪
  
  近年来防火墙对网络的保护越来越重要,特别是P2P软件越来越多的趋势下,传统防火墙并不能有效的过滤P2P软件,因此越来越多的防火墙改用Connection Classification针对整个连线进行较完整的扫描。虽然有厂商推出此类防火墙,特别针对P2P使用的动态连线端口提供了连线过滤能力,但是商业应用层防火墙的售价偏高,而且商业用的防火墙,其操作系统不对外开放,只能通过厂商的软件更新才可以升级,而P2P系统与技术的更新非常快,所以商用防火墙要一直依赖厂商推出的更新特征值或者软件升级的方式让使用者升级,使用者才有可能让所购买的防火墙可以过滤最新的P2P软件。
  而本片论文所使用的是目前网络上都可以取得的Open Source套件,也有许多热心的程序员不断地更新P2P软件的特征值,让使用者可以在花费较低成本的情况下,来达到与商用防火墙相同的目的。
  1Netfilter/iptables工作原理
  从Linux内核2.4版本开始,内置了IP信息包过滤工具Netfilter/iptables系统,它使防火墙配置和信息包过滤变得更加容易,其中Netfilter是用来实现防火墙的过滤器,而iptables则用来指定Netfilter规则并管理内核包过滤,它为用户配置防火墙规则提供了方便,通过iptables可以加入、插入或删除内核包过滤表(链)中的规则,这些规则由Netfilter及其相关模块执行。
  Netfilter是嵌入内核IP协议栈的一系列调用入口,设置在报文处理的路径上,Netfilter就是根据网络报文的流向,在以下几个点插入处理过程:
  NF_IP_PRE_ROUTING,在报文作路由以前执行;
  NF_IP_FORWARD,在报文转向另一个NIC以前执行;
  NF_IP_POST_ROUTING,在报文流出以前执行;
  NF_IP_LOCAL_IN,在流入本地的报文作路由以后执行;
  NF_IP_LOCAL_OUT,在本地报文做流出路由前执行。
  检查点分布在协议栈的流程中,流程图如下。
  Netfilter框架为多种协议提供了一套类似的钩子(HOOK),用一个struct list_headnf_hooks[NPROTO][NF_MAX_HOOKS]二维数组结构存储,一维为协议族,二维为上面提到的各个调用入口。每个希望嵌入Netfilter中的模块都可以为多个协议族的多个调用点注册多个钩子函数(HOOK),这些钩子函数将形成一条函数指针链,每次协议栈代码执行到NF_HOOK()函数时,都会依次启动所有这些函数,处理参数所指定的协议栈内容。
  每个注册的钩子函数经过处理后都将返回下列值之一,告知Netfilter核心代码处理结果,以便对报文采取相应的动作:
  NF_ACCEPT:继续正常的报文处理;
  NF_DROP:将报文丢弃;
  NF_STOLEN:由钩子函数处理了该报文,不要再继续传送;
  NF_QUEUE:将报文入队,通常交由用户程序处理;
  NF_REPEAT:再次调用该钩子函数。
  Netfilter/iptables IP信息包过滤系统是一种功能强大的工具,可用于添加、编辑和删除规则,这些规则是在做信息包过滤时,防火墙所遵循和组成的规则。
  2L7-filter
  L7-filter是基于连线跟踪和字符串匹配的网络应用层过滤方式,L7-filter是将网络上的封包在应用层的数据内容重新拷贝一份,然后把拷贝内容以字符串的形式与事先设定好的特征码进行匹配过滤。这里的特征码是以正则表达式的形式存放在.pat文件里(此处采用的正则表达式是version 8版本),并通过iptables命令将正则表达式预处理后,传到内核netfilter中,因而它具有更好的通用性和扩展性。
  以大家常用的BT为例,如果要封锁防火墙内网的BT,执行的命令如下:
  iptables -A FORWARD-m layer7 --l7proto bittorrent -j DROP
  其中bittorrent表示BT协议。在/etc/l7-filter/protocols目录下,存在一个bittorrent.pat文件,文件里存放的是BT发送的封包特征码,特征码以正则表达式的形式存放。bittorrent.pat文件内容如下:
  bittorrent //与.pat的文件名相同
  x13bittorrent protocol//BT 握手协议的封包特征
  由于L7-filter的数据是存放在内核中的,如果系统是作为路由的功能,且联机数很大时,操作系统(linux)要为连接记录分配大量的内存空间来存放相应联机数的应用层数据。因此缓冲区的长度不宜过大,另外对于一个应用程序所发送的封包而言,其握手或协商作用的封包通常是在前几个封包,当连接正常通信时,其封包特征不是很明显,因此L7-filter只检测每个连接的前若干个封包(默认值是10个,可以通过修改/proc/net/layer7_numpackets值进行配置)。
  L7-filter对封包应用层数据的预处理原理如下:
  1.基于匹配是将数据当作是字符串来处理,且‘’(二进码00000000)是字符串结尾的标志,在拷贝应用层的封包数据中出现‘’时,去掉所有的‘’。
  2.将封包应用层数据中出现的大写字符转换成小写,从而使用匹配时大小写不敏感。但是相关的匹配算法则可以实现大小写敏感。
  3.L7-filter在处理.pat文件理的正则表达式时,也是先将正则表达式中出现在的大写字符转换成小写,然后检查正则表达式的格式是否出错。
  3存在的不足之处
  3.1存在误判
  数据在网络的传输过程中,数据内容是无法估计的,基于应用层过滤的方式势必会造成误判,尽管在编辑正则表达时要求规范,但是误判还是难以避免,比如说迅雷,其发送的UDP封包的特征值是“x32”,但是从上一节介绍L7-filter预处理封包是将去除的原则,这里的特征码的正则表达式将会被处理成“^32”(其中^号表示数据开始位置),并将此规则用于迅雷封包的过滤,设定规则的命令为(网络环境的配置如上同):
  iptables -A FORWARD-m layer7 --l7proto xunlei -j DROP
  由此正则表达式可以看出,网络上的封包凡是以x32开的数据全将被DROP(阻挡)。基于网络封包数据的不可预测性,这里假设整个网络环境中,封包中数据中每个字符出现的率是相等的,第一位数据的可能是256种(ASCII码0-255),x32出现的机率是1/256,则采用“^x32”的正则表达式过滤迅雷时,会阻挡掉网络中1/256的封包,这样的机率会严重影响网络的正常传输,误判非常严重。
  另外,对于L7-filter对于字符不处理的情况下,如果P2P软件是以,或是以为特征的一部分作特征码时,L7-filter性能就非常差,并且误判也会增加。
  类似的情况还有很多,例如:BT的UDP track的特征“.........x01”等。
  3.2过滤速率较低
  在目前Linux防火墙架构中,封包必须逐一比对防火墙规则直到比对到符合的规则为止,才会停止比对。同样的Netfilter的extension matching module L7-filter也是一样,当规则使用越多,L7-filter比对的次数也越多次。与传统Layer4防火墙不同点在于L7-filter在第一次透过封包内容比对出结果后,便会在此封包所属Conntrack上增加一个辨识出来的应用软件名称,以供以后可以透过搜寻这个名称来直接比对;就如同Layer4防火墙是直接比对封包的包头来决定是否符合规则。因为将封包内容透过字符串比对是非常缓慢的。虽然有了这样的方式,但是字符串比对与传统Layer4防火墙直接比对每个封包的包头,在速度上仍有不小的差异。这种状况会随着防火墙规则数量的增加而产生性能上的落差。
  4性能的改进
  4.1L7-filter误判的改进
  鉴于L7-filter针对数据包中‘’不作处理的规则,为了提高L7-filter的性能,降低针对‘’特征码误判率问题,我们在这里对L7-filter预处理数据内容的规则进行修改。
  L7-filter在实现匹配之前,是先将数据包内容中出现的大写字母转变为小写,iptables在读.pat文件中的正则表达式时,也是先将正则表达式中出现的大写字母转变成小写,实现大小写不敏感的。但是在实际的应用中,正则表达式算法是大小写敏感的。因此我们可以将数据包中的‘’用一个特定的大写字母(在选择替代大写字母时,不能与正则表达中出现的特殊符号冲突,这里取N)来代替,用这个大写字母实现‘’匹配。因此L7-filter的字符串预处理改进为:
  1.在.pat正则表达文件中,用‘NULL’表示‘’,当iptables读.pat文件时,将NULL转化成大写字母N,然后将正则表达式转到内核数据空间。(只将代表‘’的字符串用一个大写字来代替,而其它的没有改变,仍能保证匹配的大小不敏感。)
  2.在L7-filter在组织连机的数据包时,同样要将数据中的‘’替换成大写字母N,但是,针对网络封包长度的特点,当封包中数据量太少的情况下,会在封包的结尾加一些‘’填充,来满足网络封包的最小长度要求。因此这里为了使有限的缓冲区能够存放最多的封包数量的数据和提高匹配效率,在这里先将数据包数据中结尾出现的填充字符‘’去掉,然后将数据封包中非填充字符‘’替换成大写字母N,在这里强调的是,原封包中的数据不能改动,只改动拷贝数据。
  综上所述,可以看出实现L7封包数据预处理后,能够克服L7-filter不处理‘’的缺陷。
  4.2过滤速率的改进
  我们修改图1的第一个检查点(NF_IP_PRE_ROUTING)动作如图2,在第一次比对出结果后,透过将此封包所属连线的状态标示存储在Conntrack中,当之后封包进入防火墙后,可以查询此封包所属的连线是否已经有比对结果的标示存在,若有则直接取得该结果,如果没有则依照防火墙内的规则一条一条的比对。如果封包一直没有比对结果,我们可以设定一个门槛值,当每条连线比对超过这几个封包都没有结果后,我们就可以默认策略设定为ACCEPT或是DROP写入对应的Conntrack Entry中,避免封包比对没有比对规则还会不断的进入系统比对。
  除了抛弃(DROP)与允许(ACCEPT)之外,我们增加另一额外的目的函数,称为STATE;当封包比对有结果后,可以将此结果透过STATE这个目标函数,将结果存入Conntrack[11]。
  iptables –t mangle –I PREROUTING –m statecheck –-accept –j ACCEPT
  iptables –t mangle –I PREROUTING –m statecheck –-drop –j ACCEPT
  iptables –t mangle –I PREROUTING –m layer7 –l7proto msn-login –j STATE --drop
  如上前两条防火墙的规则,是在NF_IP_PRE_ROUTING检查点最前面放置两条防火墙规则,可以让封包进入PREROUTING后马上通过我们写的statecheck matching module来对比,去查询State Table中是否已经存有应对的状态,即图2增加的检查功能部分。而第三条规则代表msn-login不被允许,除此之外目标函数STATE需在应对Conntrack的状态标记为“drop”,即图2的Save State部分。后续同一连线包一进入Netfilter后,我们的statecheck matching module即可根据此状态将其丢弃,不需要再做其它规则的比较,即图2的Apply Action部分。
  STATE目标函数除了“drop”外,还有其它函数可供使用,如“accept”、“MARK X”。
  5结束语
  随着网络的发展,未来会有越来越多的软件会使用P2P的方式做传输,相对的所使用的端口一定没有固定,甚至会伪装成其它的应用软件的端口,传统的只看固定端口来做网络安全的控管已经明显的不足。应用层防火墙的应用会越来越广,甚至在频宽管理的应用上都会采用第七层辨识的方式来控制,未来基于应用层的过滤方式只会越来越被广泛的应用。
  参考文献
  [1] The netfilter project team,“Linux Netfilter/iptables frameworks,” Nov 1999. [Online]. Available: http://www.netfilter.org/. [Accessed:Sep. 2004].
  [2]L7-filter Classifier project team,“L7-filter Classifier,” May 2003. [Online]. Available:http://l7-filter.sourceforge.net/. [Accessed: Oct.2004].
  [3]Steve Suehring,Robert L. Ziegler著,何泾沙 等(译). Linux防火墙(第3版)[M].北京:机械工业出版社,2006.12
  [4]赵炯. Linux内核完全剖析[M].北京:机械工业出版社,2006
  作者简介
  王冬霞(1983-),湖南邵阳人,东华理工大学硕士,研究方向:嵌入式系统设计及应用
其他文献
针对数据采集过程中作战环境数据项名称近似而不易区分、种类繁多且不易汇总的问题,本文以作战环境中经常出现的四类数据项—环境文件、环境数据、自然环境、集结地域为例,运
电力电子器件是半导体功率器件的总称,是构成电力电子设备的基础,是从事电力电子器件设计、研发、生产、营销和应用人员以及电源技术工作者应该熟悉的内容。本刊从今年4月份开
蛋白质二级结构预测是生物信息学的重要组成部分,在生物信息学领域具有重要意义。本文提出了一种新的卷积神经网络结合Softmax分类器的算法预测蛋白质二级结构。首先用改进的
介绍了视频采集与显示的基本原理,给出了选用VerilogHDL语言设计Video_to_VGA模块,并由视频解码芯片ADV7181输出数字视频信号以进行显示的设计方法。该方法中的Video_to_VGA
针对传统谱聚类基于欧氏距离度量样本之间的相似性,不能反映样本的概率分布特性,特别是具有多峰分布的样本聚类,欧氏距离具有较大的偏差,另外在传统谱聚类中广泛使用的k-mean
国瑞·西安金融中心工程采用核心筒+外框架的钢筋混凝土混合结构,在选择施工方案时,针对核心筒的结构特点研究塔式起重机、爬模、布料机、钢柱分节、混凝土强度的相互关系,对
节俭皇帝杨坚隋文帝杨坚是以节俭著称的皇帝。一个封建皇帝,拥有最高权力,“普天之下,莫非王土”,如能做到不奢侈,已属不易,而杨坚极力要求自己过着平民百姓一般的简朴的生活,更是难
列出了过热器爆管破口的宏观形貌和特征。通过对爆管原因的分析,提出了预防爆管的措施。
介绍了16位100 Msps高速模数转换AD9446的主要特点、引脚功能和输入输出特性,提出了基于AD9446的高速数据采集系统的设计方案。此系统能在复杂环境下完成微波近场医学特征回波
<正> 目前糖厂酒精车间成品酒精含醛较多,影响酒精质量。如何解决这个伤脑筋问题呢?作者认为,根据乙醛的性质,利用一切机会来排除乙醛,开展技术革新,定可提高酒精质量。综合