论文部分内容阅读
数字水印技术是一种将特制的、不可见的标记,利用内嵌的方法隐藏在数字文本、图像、视频等数字内容中的技术,它被用来确定版权的所有者、认证数字内容的完整性等。近些年来,随着电子文档的广泛应用,文本水印的研究受到了科研人员们的广泛关注。本论文利用汉字的结构信息及Hopfield神经网络的联想记忆功能,探讨了一种汉字五笔字型拆分的零水印算法和一种Hopfield神经网络与同义词替换技术相结合的可恢复文本水印算法。本文的主要研究工作如下:(1)系统地阐述已有文本水印算法的基本原理、各自的优缺点及当前的文本水印研究现状。(2)利用五笔字型拆分原理,提出了基于汉字五笔字型拆分的零水印算法。该算法利用五笔字型拆分编码信息,将中文文本转化为英文字母文档,然后以元音字母为标志,提取相邻元音字母之间的字符总数及出现次数最大的字母信息,得到原始文本的特征信息,最后以零水印的方式实现水印的嵌入。仿真结果表明,该算法不仅具备较好的不可见性,还能实现文本内容的篡改检测和定位。(3)利用Hopfield神经网络的联想记忆特点,将Hopfield神经网络应用于文本水印,提出一种基于Hopfield神经网络的自然语言文本可恢复水印算法。该算法利用同义词替换技术嵌入水印,通过计算上下文搭配度的方式,对同义词进行筛选,以确保可替换同义词被替换后不会引起语义歧义。将可替换同义词和其筛选出的同义词组成该可替换同义词的同义词库,并对库中的词语进行位置编码,根据原始文本中的所有可替换同义词的编码信息获得原始文本的特征序列,然后利用Hopfield神经网络对原始文本特征信息和水印信息进行记忆训练,以实现原始文本的恢复。仿真实验表明,该算法具有良好的不可见性、鲁棒性和可恢复性,不仅能够有效抵抗各类格式攻击,而且能够抵抗针对可替换同义词的攻击,并较好地还原原始文本。