基于语句重述的自然语言文本水印技术

来源 :哈尔滨工业大学 | 被引量 : 0次 | 上传用户:linmu22952
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子文本的普及和广泛应用,电子文本逐渐成为人们传递信息,记载重要文件的主要手段之一,针对电子文本的保密传输的研究应运而生.该文在充分调研国内外的相关研究后,结合汉语的实际情况,实现了一个基于句法结构分析的文本水印系统,并完成相关实验.该文主要介绍基于自然语言处理的文本水印技术,也即自然语言文本水印技术.该技术是在不改变文本原意的前提下,将需要隐藏的文本信息(水印信息)插入到原始文本中的一种信息隐藏技术.这种技术对于确认信息来源和信息的秘密传送,以及版权维护等方面都有着很大的应用价值.该文首先给出了基于自然语言处理技术的文本水印的概念、特点及攻击模型,并对文本水印的研究现状进行了分析.通过分析可以看出,自然语言文本水印技术有着更好的灵活性,并且在适度的攻击下,不会破坏水印信息.该文详细介绍了文本水印系统的设计过程,包括该技术的基础数学理论-二次余数理论.最后详细介绍了两种自然语言文本水印嵌入方法,分别是基于句法分析和基于语义的水印嵌入方法.我们使用句法分析的方法对水印系统加以实现.在实现过程中,重点研究了自然语言领域一个重要的课题语句重述(Paraphrases).为了实现语句重述建立了大型重述语料库资源,并对他们进行段落和句子对齐,从中提取了二万三千对Paraphrases句对.利用cotraining算法自动提取Paraphrases.该文在实验以上各种方法的基础上,融合每种方法的优点,构建了一个中文自然语言文本水印模型.
其他文献
该文通过机器人部队(群机器人)追捕一个和多个猎物的过程来研究多个有限理性智能体在动态复杂环境下的最优合作机制与决策算法.具体研究以下几个主要方面:首先,提出多智能体
随着应用的深入和计算技术的发展,并行计算在数值计算领域里扮演着越来越为重要的角色,成为了解决很多大规模科学计算问题的唯一途径。 并行计算的应用离不开并行软件的支持
本文在分析和研究当前计算机辅助教学(CAI)状况的基础上,采用积件化的设计思想,研究和开发了基于Authorware的多媒体课件自动生成系统。该系统将课件的内容和结构分离开,为教师
该文主要研究由重力加速度变化(如在飞机上)而引起的应力变异,在对应力变异语音有效分析的基础上,分别从基于特征和基于模型角度提出可以抑制应力变异影响的有效方法.从基于
数字指纹图像识别是人类生物特征识别技术中最早应用、技术最为成熟、价格最低廉的分支,被广泛地应用在刑侦破案、住宅安全,银行、证券、保险等金融机构的身份确认,重要区域的门
随着科学技术的飞速发展,信息高速公路的普及,人们已经被包围在信息的汪洋大海之中。Internet是海量信息源,而且其信息的组织是异构的、多元的和分布的。由于信息不断地更新和增
本文从SNP标记数据和基因表达谱数据的分析着手,以挖掘复杂疾病基因和研究基因功能为主要目标,发展创新的模式识别方法、数据挖掘技术和生物信息学领域知识匹配技术,提供SNP
自动语音识别技术(Automated Speech Recognition,简称ASR),它是一种将人的语音转换为文本的技术。语音识别是一个多学科交叉的领域,它与声学、语音学、语言学、数字信号处理理论
对智能家居系统的研究虽然只有短短20年的历史,但其发展速度却是惊人的。现在很多家庭、小区都在某种程度上实现了“智能家居”。智能家居系统的一个重要设计部分是家庭网关的
本文提出了结合两种分形维数作为纹理特征的概念,考虑到分形维数的适用范围,又引入广义维数作为纹理特征的方法,以上述两种不同方法提出的纹理特征为基础,以基于内容的图像检索为