论文部分内容阅读
从当前大量发表的论文来看,国内外现有的文本信息隐藏技术在水印容量、隐蔽性、鲁棒性、安全性之间普遍存在着不可平衡的矛盾且国内外的研究主要是基于英文文本格式的信息隐藏,国内在这方面的研究起步较晚,基本停留在对国外研究成果的补充和改进上,而关于汉语的相关研究则更少。汉字是一种颇具特色的文字,它的结构独特,基于英文文本格式的信息隐藏技术大多都不适用于中文文本,对于我国这样使用汉字记录信息的国家来说,根据汉字独特的特征,研究基于中文文本的信息隐藏将是一个极具潜力的研究方向。鉴于此,本文在查阅和分析大量文献资料的基础上,以在中文Word文档中加入秘密信息用来保护版权为探索出发点,针对目前文本水印算法存在鲁棒性较差、隐蔽性不够和水印容量不大的问题,研究并提出了一种基于汉字特征的中文文本数字水印算法。本文详细设计了该算法的流程。首先对常用汉字出现频率及笔画数进行大量的统计分析,得出依据平均笔画数将整个文本较均匀分成二块的思想;再按出现频率的高低为顺序将二块中各汉字排好序,把秘密信息按相反的顺序分别重复嵌入到文本二块的各汉字中;嵌入时保证相同的汉字嵌入的水印比特信息是相同的。这三条嵌入位置的选择策略,增加了攻击者进行有针对性攻击的难度,提高了受攻击后水印的恢复能力。此外本文还研究了以汉字为单位的某些特殊属性,把属性值的修改与否作为水印嵌入的方式,在不影响文本正常使用的同时具有非常高的隐蔽性。同时本文在水印的生成阶段还用到了公钥算法RSA非对称加密技术,充分保证了水印的安全性,防止未经授权的检测与嵌入。并且利用(7,4)汉明码原理,对水印信息进行纠错编码,利用纠错码检测文本水印的完整性,较好地进行篡改检测和差错恢复。最后本文对水印的各个性能进行了大量测试,有针对性的模拟了对文本数字水印的攻击。实验证明,本文研究的算法具有明显的中文文字特色,具有较高的隐蔽性、鲁棒性和抗攻击能力。本文算法的最大特点是强鲁棒性,能够抵挡来自于文本格式方面的任何攻击和对文本内容的局部破坏。