论文部分内容阅读
二十一世纪最重要的特征之一是在计算机网络基础上的人类社会各领域的信息化,信息科技领域的各种新理论、新技术竞相出现。信息的自由、高效流动,万物的高效互联为经济、社会的高速、高效、健康发展提供了巨大的支持和保障。人民的生活、工作、学习也大受裨益。然而,伴随着信息网络的快速发展,与网络信息技术相关的风险及问题也逐渐凸显,甚至日益尖锐。一方面,网络的使用过程中,尤其是科研、办公类的专用网络中经常出现有意或无意的不合权限的网络使用行为,如使用违规软件,进行许可之外的其他活动等;另一方面,信息计算机网络中还存在着对受限信息恶意窃取甚至于破坏的现象。在整个网络系统层次,当前各组织、机构对计算机网络有极高的依赖。因此,要求信息网络必须供高效、可靠的服务。对网络进行实时检测以及定期进行日志的分析,从而为网络的维护提供依据,也显得尤为重要。在这种情况下,不断将新的网络应用审计技术引入到计算机网络审计系统中就变的十分必要。本文在对当前网络应用内容审计技术进行了大量研究、分析的基础上,对网络审计中的关键技术进行了创新、优化。本文首先提出了一种对计算机网络中终端数量、状况检测的技术,这为进一步对网络应用内容的审计技术提供了网络结构基础。使得网络应用内容审计的结果可以对应到具体的网络终端之上,从而提高了网络内容审计结果的准确度和可用性。紧接着,本文研究了针对HTTP的网络内容审计信息的发现、提取技术。对HTTP相关网络内容审计信息的发现、提取研究分为两个大的部分,第一部分对HTML文档即Web页面进行结构分析,研究其中信息元素的分布,并根据该分析,从总体、细节两个层次设计方法对信息元素进行提取;第二个部分对网络HTTP报文所包含的可用于网络内容审计的信息进行研究,并设计方法提取。最后,针对当前网络结构复杂,内容信息庞杂的现实,将分布式大数据处理技术引入到网络应用内容的审计之中。将传统经典的数据分析、挖掘算法与创新数据处理技术相结合,较大程度上提高了网络内容审计的效率及准确性,为网络应用内容审计展现了一个新的思路和方向。