论文部分内容阅读
基于自然语言的文本水印是近年来文本水印研究的热点。基于自然语言的文本水印鲁棒性强,安全性好,但在不同程度上改变了文本中的词句,扭曲了文本原义,限制了实际应用。在一些关键性的应用领域,如军事、法律和文学等,文本内容的改变是不可容忍的。为此,迫切需要一种不但能够嵌入和提取水印,而且可以完整地恢复原始文本内容的技术。目前存在一种图像可恢复水印技术,可以实现在提取水印的同时,恢复出原始图像。本文借鉴图像可恢复水印技术,展开基于自然语言的文本可恢复水印技术研究,提出了两种既可以嵌入隐秘信息,又可以恢复原始文本内容的水印技术。本文的主要工作如下:首先,借鉴图像中可恢复水印的思想,首次提出了文本可恢复水印的概念。然后,深入分析了文本与图像在嵌入水印方面的差别,并在此基础上,、提出了两种基于自然语言的文本可恢复水印算法。第一种是基于整数可逆变换的文本可恢复水印算法。算法中用到的可逆变换具有以下特性:在正变换得到的整数对的每个元素丢失最后一位的情况下,其逆变换得到的整数对的每个元素要比原整数对小一。因而可以在整数对的最后一位嵌入一位水印。该算法首先将文本中的可变换的词句转换成整数形式并将这些整数分成对,然后在转换来的整数对中利用整数可逆变换嵌入或提取水印,最后,利用更新后的整数对,得到嵌入水印的文本或原始文本。实验结果表明,该算法在嵌入用于恢复原始文本内容的信息后,能够再嵌入足够辨别文本版权的信息。第二种是基于改进的差值扩展的文本可恢复水印算法。改进的差值扩展方法选择在同义词序号或句型序号的最后两位,而不是最后一位,嵌入水印。而对差值扩展后不能改变的整数对,将整数对的差值作为直方图的横坐标值进行直方图平移,以进一步提高嵌入容量。该算法相对于传统的差值扩展算法来说,提高了嵌入容量,可以应用于文本可恢复水印。