汉语语句组块及消歧的研究与实现

来源 :电子科技大学 | 被引量 : 0次 | 上传用户:onewxf
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
自然语言处理是语言学、逻辑学、生理学、心理学、计算机科学和数学等相关学科发展和结合而形成的一门交叉学科。自然语言处理的目标就是让计算机能够处理人类语言,并作出人们所期待的各种正确响应,建立起人与机器间密切而友好的关系,以便进行高度的信息传递与认知活动。随着计算机和因特网的推广应用,由数据处理、信息处理发展到知识处理,对语言文字处理要求的深度和广度越来越高,自然语言处理问题已成为了网络社会和网络经济发展的瓶颈。目前自然语言理解的研究仅仅处在让计算机正确理解语言信息的程度上,计算机的智能还远远没有达到能够象人一样理解自然语言的水平。计算机从诞生之日开始就是以处理印欧语系为基础的,再加上汉语是意形结合的语言,缺乏形态变化,比西方语言复杂,因此计算机处理汉语很困难。为了解决句子的理解问题,计算机必须通过句法分析、语义分析和语境分析得到句子的形式化机内表示。计算机对语言的分析和理解过程是一个层次化的过程,分为词法分析、句法分析和语义分析。目前句法分析使用的方法主要有基于统计的方法、基于规则的方法和采用规则和统计相结合的混合方法。在语义分析上的研究大多是在句法规则的基础上加强语义分析、研制语义信息词典,借助语义特征、语义关系、配价分析等条件识别句子中的各个成分,找到成分之间的结构关系和结构意义。这些方法运用很广,但它们往往会因分裂句法和语义的关系而歧义丛生,造成语句的理解错误。本文提出一个全新的思路来分析语句和消除层次结构歧义及语义歧义。这个方法突破以往只从句法上分析语句的局限,将句法、语义、语用三个平面结合起来。首先在句法和语义平面利用《知网》和《现代汉语语法信息词典》抽取必要的语法和语义信息构成词汇复杂特征集,再以词汇复杂特征集的功能描述为基础,对语句运用合一运算进行组块。然后在语块内利用CYK算法和《知网-中文信息结构库》改写的CNF进行层次结构消歧和语义消歧。对于无法直接运用该方法消除的歧义,将借助语用平面结合具体的语境进行处理。
其他文献
密码协议的安全性分析对于保障计算机网络的安全通信具有重要意义。运用形式化方法对密码协议进行分析一直是该领域的研究热点。目前密码协议的形式分析方法包括:逻辑方法、
随着Internet技术的发展,Web系统开发已经成为企业信息系统开发的一个重要组成部分。同时,目前存在着大量的既存系统,不能够简单抛弃,所以全球掀起了将既存非Web系统Web化,即Web再
本论文从事在嵌入式系统中研究和实现安全通信协议SSL/TLS 的工作。由于嵌入式系统的日益广泛应用,它与网络通信的结合也成为了一种趋势。网络安全成为制约着嵌入式系统向更
许多计算智能领域,如人工神经网络、遗传算法等已经成功地应用于计算问题的解决。而对另一些计算智能技术的探索则比较晚,许多问题还未解决,如模拟自然免疫的人工免疫、群集
本文首先进行虹膜图像预处理,主要是结合虹膜图像的特点,进行虹膜图像增强、虹膜图像灰度归一化以及典型疾病特征区域大小归一化。 特征提取是本研究的重点,本文在比较
学位
信息时代,随着Internet的发展、数字高清晰电视、网络电视和3G技术的应用,视频压缩编码技术越来越受到重视,它作为计算机多媒体技术的一个分支学科,近年来在国际上逐渐成为研究热
医学图像在疾病诊断和治疗中的作用日益重要,因此计算医学图像解剖组织的精确的几何模型就成为一个富有挑战性的问题。处理这种问题的一种比较有前途的方法是使用变形模型。
安全问题是电子商务系统要解决的核心问题。各种安全问题,给电子商务活动造成巨大的损害。基于移动Agent的第三代电子商务系统,集软件、通信、分布系统的技术于一体,克服了传
现代计算机技术极大地促进了计算科学的发展。在实践中,由于受到物理器件极限速度和技术水平的限制,使得单处理机远远满足不了现代许多领域中具有挑战性的大规模计算课题对计