基于HNC理论的句子语义相似度计算的研究

来源 :北京师范大学 | 被引量 : 0次 | 上传用户:competent110
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
在自然语言处理中,句子相似度的计算是一项重要而又十分基础的课题。它在自然语言处理中有着广泛的应用,例如,在基于实例的机器翻译中的元语言检索,信息过滤技术中的句子模糊匹配,面向常问问题集的自动问答系统的问句检索,以及拼写检查、数据清理等领域,相似度计算都是一个非常关键的问题。   本文利用HNC(概念层次网络)理论网络化的概念基元符号体系和完善的语句语义表述模式深入探讨了句子语义相似度计算的问题,并在此基础上完成了对算法的实现和结果的评价。   首先,本文介绍了词汇语义研究和句子相似度计算相关研究的流行算法和研究成果,进一步分析了现存方法的优点与不足,这为本文提出新的算法与解决方案提供了有益的指导。   词语的HNC符号标注是理解句子语义的一项重要的前导性工作,这就涉及到多义词的词义消岐问题。本文在对HNC理论的词汇语义描述方法进行深入研究的基础上,提出了基于HNC理论的词语搭配度计算方法,进而提出了新的词义消歧算法,完成了词语的HNC符号标注。   随后,本文在深入探讨HNC理论的语句表述模式和句类分析技术的基础上,提出了基于HNC的句子语义相似度计算的方法,完成了语义块识别算法、关键词抽取算法和相似度计算算法的设计与实现。   最后,本文在理论研究和算法设计的基础上,通过实验验证了算法的有效性,并对实验结果做了充分的分析。     
其他文献
监控系统有着广泛的应用场合,如银行、仓库、交通等。监控系统的智能化是未来发展的方向。在智能监控系统中,运动检测是系统中的一个重要组成部分,并且运动检测的效果直接影响智
随着全球信息化和Internet技术的迅速发展,信息化建设水平已成为衡量一个国家和地区综合实力的重要标志。在信息化建设进程中,信息的安全问题日益突出,作为信息网络安全的一
为了满足轨道交通的正常运营和紧急状态的报警、乘客疏散、救灾等要求,在轨道交通上设置了环境与设备监控系统(BAS)。BAS系统对全线车站及区间隧道的环境和机电设备进行全面
学位
基于互联网的协同工作环境对于当代科学研究活动有着重要的意义和作用。在协同工作环境中存在着大量的文档,而传统的文档共享方式存在着文档需等待下载、浏览需安装特定客户端
计算机网络是人们正常工作不可缺少的基础设施。然而面对多源异构的各种海量安全信息,管理人员频于应付各种突发事件,难以发现真正的安全隐患。整合各种安全事件信息,消除信
血细胞显微图像处理是医学图像处理中的一个重要分支,也一直是生物医学工程研究中一个十分活跃的领域。医学上的许多发展都离不开显微图像处理。血细胞图像处理工作主要集中
随着软件规模的扩大,遗留系统问题越来越突出,软件演化问题逐渐成为今天软件工程研究的热点。软件演化过程,作为软件演化和软件过程的交叉学科,已成为了软件工程的一个关键领
随着高级编程语言和微处理器技术的不断发展,编译优化问题的复杂程度在迅速增加。现代优化编译器通常采用几十个甚至上百个优化遍来对程序进行优化以覆盖尽可能多的优化机会。
学位
图像数据的数量正以惊人的速度增长,它在给人们带来方便的同时,也面临着如何有效地对这些海量数据进行分析、存储和检索的问题。这篇论文主要针对基于区域的图像检索系统中的相
密码技术中,在达到相同的安全强度的情况下,椭圆曲线密码可以使用较短的密钥实现。但随着计算能力的发展以及并行分布式技术的产生,暴力破解密码在时间上成为可能,我们必须使用更