基于自然语言处理的文本数字水印技术研究

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:starfox_vip
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着网络技术的飞速发展以及信息化进程的迅速推进,数字媒体已成为成为当今社会一种重要信息媒介。互联网的便捷性和数字媒体复制的低成本,在促进数字产品的在现实中应用迅速发展的同时,也带来了一系列挑战。其中,数字信息传播的不可控性使得数字媒体的版权保护问题变得倍受关注,而数字水印技术正是解决这一问题的有效技术手段之一。在众多的数字媒体信息中,文本信息的传播和应用都是最广泛的,文本内容更有价值,却更容易复制,所以针对文本数字水印的研究变得更加急迫。目前,针对文本水印大部分的研究是基于文本格式的,最典型的研究是字移、行移和特征编码等,而此类水印算法的鲁棒性较差,且无法在无格式文本中实现水印。本文针对文本信息版权保护的需求,提出了基于词性标注序列的文本水印算法和改进的语法水印算法,能够很好解决基于格式水印出现的问题,鲁棒性、隐蔽性以及容量方面都很具有很好的性能,并且结合这两种文本水印算法的特点,实现适用版权保护的多重水印技术。本文首先提出了一种基于词性标注序列的文本水印算法,通过分词和词性标注技术将文本内容映射为词性标注序列,利用Huffman编码,将水印信息的产生和解码转化为文本内容与词性标注序列的关系,该算法是一种零水印算法,改变了传统数字水印必须改变载体内容的工作方式,与传统方法相比具有更好的隐蔽性和更广泛的适应性。然后,本文针对M.J. Atallah教授的提出语法水印算法容量较小的问题,通过加入介词短语与分词短语和从句的之间的转化,以及随机组合等方式丰富语法转换方法,引入可嵌入集合和不可嵌入集合,利用语法结构变换将水印信息分段嵌入,进而改进了Atallah教授提出的语法水印算法。本算法最大限度地利用文本中可以进行语法转化的句子,实现语法水印的最大容量嵌入,并具有较强的鲁棒性。实验表明该算法和原有的语法水印算法相比,水印嵌入容量平均提高58.2%,有很大程度的提高。在最后,本文基于课题在课题中前面的两种文本水印算法,提出基于多重水印技术的版权保护方案,进而针对MS Word文档实现版权保护系统,这对于网络图书馆和电子出版的应用都有着非常深远的意义。
其他文献
计算机和网络技术的不断发展将人类社会带入了信息化时代,随之而来的是倍受关注的信息安全问题。公钥基础设施(PKI)是解决信息安全问题的一种有效的方法。PKI的核心是认证中
肺结节是肺癌早期的主要征象之一。基于CT图像的结节检测与良恶性判别已成为国际上的研究热点之一。对结节的边界进行准确的分割是要解决的关键问题。基于C-V几何活动轮廓模
高可用集群是高性能处理器、磁盘阵列通过高速网络连接起来的能够提高系统服务可用性的并行体系结构。由于其高性能、高可用以及可扩展性好等特点目前已成为并行处理领域发展
Web2.0的兴起,使人与网络的交互程度增大,尤其是社交网站的出现,把实际生活中的人际关系和行为映射到网络,带来了网络上的朋友和人脉。社会网络的发现、挖掘、以及基于社会网
云计算的飞速发展伴随着许多大型数据中心的建立。海量的数据中心会消耗巨大的电力能源,增加云计算的操作成本,并导致二氧化碳的排放量升高,对全球气候造成影响。随着云计算
近年来,随着计算机与通讯技术的迅猛发展,笔记本电脑、手机、PDA等异构设备已融入到人们日常的生活中。这些异构设备具有截然不同的软硬件环境(平台不同,屏幕大小也不相同)。
随着无人战斗机在军事领域上的应用越来越广泛,世界各国都在下大力气研制无人机,无人战斗机的出现也将改变未来的空战态势,成为决定战场的重要力量。在这其中,无人机的智能化
随着多媒体技术和网络技术的飞速发展和广泛应用,对数字多媒体产品的存储、处理和传输变得越来越方便和快捷,但同时也带来了数字版权的问题。采用传统的加密技术,对其进行保
P2P系统(Peer-to-Peer)已经成为Intemet中最重要的应用系统之一。然而,P2P系统所具有的开放、匿名等特性使得节点可以肆意传播非法内容,滥用网络资源,导致不可靠的服务质量及存
随着3G应用的普及,在接入速率和适应环境上与3G技术互为补充的无线局域网(WLAN)迅猛发展,成为新一代高速无线接入网络,在3G的补充技术方面脱颖而出。同时由于多媒体技术的发