【摘 要】
:
在自然语言处理(NLP)中,歧义问题一直是研究的重点和难点。它是一项“中间任务”,对于自然语言处理中的许多应用领域具有重要的理论和实践意义,包括机器翻译、信息检索、句法分
论文部分内容阅读
在自然语言处理(NLP)中,歧义问题一直是研究的重点和难点。它是一项“中间任务”,对于自然语言处理中的许多应用领域具有重要的理论和实践意义,包括机器翻译、信息检索、句法分析、语音合成等,该问题解决的好坏将直接关系到这些应用问题的效果优劣。尤其是短语结构的歧义,它已经成为影响句法分析效率和准确率的重要因素。
本文主要是在研究获取支持短语结构消歧的方法基础上,给出了一整套基于语义相关度计算的短语结构的歧义消解策略。论文主要从以下几个方面作了重点研究和创新:
首先,介绍了短语结构歧义的类型,比较和详细分析了以往的短语结构歧义消解策略,提出了基于语义的短语结构消歧策略;同时通过比较分析了各种语义学的理论及各种语义知识表示方法后,提出了利用知识图的知识表示方式来表示语义知识。
其次,给出了知识图中的语义知识资源是根据知网中语义词典自动生成的,及在短语分析过程中生成短语图的原理。本文将把语义知识应用到了语义计算上,详细分析了基于语义词典的相似度计算原理,并提出了基于知网语义相关度计算方法。该方法利用知网中义原之间的纵向和横向关系及实例因素计算出不同词性的相关度,根据相似度的对称性计算实例的影响因素,由此提高语义相关度的准确率。
最后,关于短语结构的歧义消解的进一步工作进行了总结和展望。本文提出的基于语义相关度计算的短语结构消歧模型,使得汉语句法分析效率得到了进一步的提高,在自然语言处理中歧义消歧系统的开发有一定的指导和借鉴意义。
其他文献
随着计算机和网络通信技术的发展,数字签名技术应运而生。但数字签名是传统签名的电子模拟,不能提供代理签名的功能。代理签名是数字签名中的一种特殊的签名形式,是原始签名
随着计算机网络和多媒体技术的飞速发展,互联网已成为人们发送和获得信息的主要途径,但也随之带来了盗版泛滥和侵权行为的频繁发生,因此如何保证多媒体信息的安全已成为当今国际
概率极限理论是概率论的主要分支之一,也是概率论的其他分支和数理统计的重要基础。前苏联著名的概率统计专家Kolmogorov曾说过:概率论的价值只有通过概率极限定理才能被揭示,没
时间同步是分布式系统中经典的课题,是分布式网络计算中的核心技术,随着计算机技术和网络通信技术的迅猛发展,人们对该课题研究给予了更多的关注。 本文主要是在研究网络时间
腹腔主动脉瘤是一种中老年群体中出现频率较高的高危疾病,其外在表现为主动脉的退化性扩张。在腹腔主动脉瘤的诊断中,对瘤体的测量以及其破裂风险的评估是进行手术治疗与否的
云服务提供商通常为用户提供长期预留和短期按需租赁两种资源租赁方式。长期预留方式可获取资源租赁折扣,用户须持续租赁整个工作流的运行时间,资源利用率相对较低;短期按需
机群以其良好的灵活性和可扩展性及性能价格比,获得了越来越多的大学及科研机构的青睐。目前的许多研究是在并行机机群或工作站机群上进行的。本文介绍了并行计算的基本理论及
不确定规划是处理不确定环境下优化问题的理论工具,它提供了随机规划、模糊规划、粗糙规划以及模糊随机规划等多重甚至是混合不确定变量的建模与求解的基本原理。本文所研究的
小水电作为可再生清洁能源,是社会发展的重要组成部分。兴建水利为人类带来经济利益和生活便利,也产生了一系列河流生态问题。近年来,小水电研究随着可持续发展理念以及生态和谐经济理念的提出取得了巨大的进步,尤其是在智能优化调度和设备节能方面有了长足的进步,在调度中考虑生态因素也成为小水电优化调度的趋势。而生态因素衡量标准中最重要的指标就是适宜生态径流值,因此找到合适的生态径流计算方法至关重要。本文改进了适
近年来随着P2P应用种类和用户规模迅速增长,互联网所面临的网络拥塞、难于保障QoS等问题显得更加突出。以CERNET天津结点(天津教育城域网)为例,由于大多数终端用户使用静态IP地址