论文部分内容阅读
网页已经成为人们生活中不可缺少的部分,但是网页却处在一个相对开放的网络环境中,其面临着被非法人员篡改的危险,因此,保护网页信息的真实性是一个非常重要的课题。本文首先阐述了网页面临的严峻安全形势及网页篡改检测的重要意义。接着介绍了网页篡改检测的方法,以及基于数字水印技术的网页篡改检测研究现状。最后本文介绍了自己的研究工作。本文的工作主要包括以下几个方面:1)分析了近几年的基于数字水印的网页篡改检测方法以及相关的网页信息隐藏技术,设计了一种基于HTML编码的网页信息隐藏算法。该方法利用网页字符的HTML编码的不同形式,并将其与字符的位置联系起来,以达到隐藏信息的目的。接着,设计了一种基于网页标签位置的脆弱水印方案。该算法首先将字符串形式的水印信息转化为二进制“01”序列。通过将网页的信息的MD5值作为伪随机函数的种子产生一系列的标签字符位置序列。最后将水印信息按照位置序列的顺序嵌入到网页标签字符中。实验表明该算法能够通过判断水印信息的改变来确定网页信息是否被篡改。2)介绍了基于数字水印的网页篡改检测方法的基本原理,设计了基于数字水印的具有篡改定位能力和网页认证功能的网页篡改检测算法,该算法利用一幅有意义的图像作为网页认证的标志。首先将图像置乱后分块,同时将网页按照空格符分段,之后利用分块的图像与分段的网页生成水印,然后嵌入到每段网页之后。当网页发生篡改后,提取的水印信息能定位网页篡改的位置,同时提取的图像信息能够达到网页认证的目的。实验表明本算法很好地实现了这两项功能。3)大多数基于数字水印的网页防篡改方法都不能定位网页篡改的位置,能定位篡改位置的算法却又极大地增加了网页的大小,针对基于数字水印的网页篡改检测算法的这一弱点,提出了基于布隆过滤器的网页篡改检测算法,该算法首先将网页源文件进行分段等处理,然后通过布隆过滤器生成网页的Hash码。检测时,通过Hash码来定位网页的篡改位置,这样只需要保存网页生成的Hash码而不需要对网页文件进行任何操作。实验表明本算法能准确地定位网页的篡改位置。