基于中心语驱动短语结构文法的句法和语义分析

来源 :上海外国语大学 | 被引量 : 3次 | 上传用户:coudoudou
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
句法?语义分析是现代语言学研究的热点之一。句法分析旨在获得输入句子的句法表达式。语义分析旨在获得输入句子的语义表达式。分析的传统方法是分析作为重写规则的推导。近年来出现的新方法是分析作为逻辑的演绎。中心语驱动短语结构文法(HPSG)是由Pollard和Sag于1994年提出来的。HPSG采用合一作为句法和语义分析的基本运算是非常理想的。由于在语言学理论和实际的自然语言应用之间存在巨大的差距。以及具体的识别过程并未显式地包含在文法之中,所以自然语言句法?语义分析应包括文法、算法和另外的表示方法。现已有词类最简文法(CMG)及HPSG粘贴语义等逻辑演绎系统,和基于重写规则推导的HPSG派生算法等。然而它们有时还有些问题,如多量词句子的界面不能被建立,某些句子属性传递的缺失,分析过程信息没有被全部记录,和UDC句子的语义规范化有待于解决。针对上述问题,本文主要作了以下五个方面的工作:第三章提出HDS。HDS是一个HPSG演绎系统作为部分可交换线性逻辑的片断。HDS的特点是:1.保留HPSG中被粘贴语义去掉的类型“参数化情势”。2. HDS处理了HPSG的次范畴原则、中心原则、语迹原则和语义原则。HDS由词汇项一般形式和十条演绎推理规则组成。词汇项在HDS中作为公理。它由PHON属性、类型,和PHON属性的λ?项三部分组成,词汇项还表示了类型和PHON属性之间的Curry–Howard对应。十条规则包括:逻辑蕴涵联结符的引入律和消去律,积的合成律,和放松假设的次序的熵规则。HDS的作用是:通过分析作为逻辑的演绎,可建立句法对象和语义对象,及其二者之间的界面。HDS能够解决词类最简文法(CMG)和粘贴语义有时难以得到多量词句子的句法-语义界面的问题。应用例子表明了HDS的有效性。第四章提出HDS的自动分析算法以解决HDS的可分析问题。(1)通过把“积对变量同时进行替换”提升至“通过积的投射进行扩展”的机制,提出了HDS的n元积?的消除规则,从而扩大了HDS的应用范围。(2)提出HDS的自动分析算法。HDS本身是一个逻辑演绎系统,因此它没有显式地包含具体的句法-语义分析演绎过程。而HDS的自动分析算法可以实现HDS的具体演绎过程。算法的特点是:类型驱动,归约演绎,和避免重复的局部分析。优点是:每个局部分析只需建立一次,即使它后来成为许多局部分析的一个成分。从而减少了归约次数。最后检查了应用实例。结果显示我们的工作是有效的。第五章提出基于句法结构树上属性依赖归纳机制(T-IDP)的HPSG属性分析的新方法。1.基于属性文法,定义了上下文有关文法的属性产生式。定义了适用于多种情况下的属性依赖关系。和给出了在HPSG句法结构树上归纳的属性依存关系的递归定义。它的特点是:具有T-IDP,即,在句法结构树中,把各个属性依赖关系的个别性情况,归纳成完整的属性结构树的一般性结论.2.提出基于T-IDP的HPSG属性分析算法。应用实例表明了算法的可行性。算法的时间复杂性为O(n3),从而算法是有效的。我们的工作可以解决下面的问题:某些HPSG分析算法没有考虑到自然语言结构中跨模板属性传递路径或者约束下的属性传递路径。第六章提出融自动实现HPSG句法/属性分析和记录分析过程信息为一体的谓词/变迁Petri网(Pr/T网)。Pr/T网由两个部分组成。第一部分分析输入字符串的结构。第二部分处理输入字符串中各部分之间的属性关系。并且建立相应的属性结构树。Pr/T网由多个令牌、库所和变迁组成。个性化令牌携带多种数据结构,动态谓词的库所储存信息,条件导向的变迁处理分析,自动实现HPSG句法/属性分析和记录分析过程中丰富的上下文有关信息,且回答了句法/属性的结构问题。我们给出了应用实例,结果显示Pr/T网分析和记录信息的可行性。Pr/T网除了能克服现有二种语言识别器,即下推自动机和双向有限自动机,有时不能处理HPSG中复杂的属性关系的局限性外,还能克服下推自动机不能记录分析过程全部信息和双向有限自动机不能记录分析过程全部信息的局限性。第七章提出形式语义融合法(FAFS)。该方法融合了λ-抽象,λ-演算和HPSG。FAFS旨在解决UDC句子语义的规范化表达式问题。首先,我们采用了HPSG的上下文有关属性文法。FAFS建立UDC句子的S-结构,区分基于HPSG句子属性结构树的强弱UDC句子,提取与语迹相对应的填充词。然后,FAFS根据HPSG句法结构树得到UDC句子的合适表达式(WFF)。对句子PHON标记λ-抽象并施用于填空词,λ-演算获得UDC句子语义的规范化表达式的范式。在句子的相同直觉解释中,范式是最简形式。FAFS总体的计算复杂性是O(n3),因此FAFS是有效的。最后,应用实例表明了FAFS的可行性。FAFS可克服下述局限性:重写规则不能把UDC句子中相应的填空词填入语迹位置、更无法把弱UDC句子中没有出现的相应的共索引词填入语迹位置。本文工作的创新点如下:(1) HPSG扩展至HPSG演绎系统作为部分可交换线性逻辑的片断(HDS),及HDS自动分析算法。(2)具有属性依赖归纳机制(T-IDP)的、句子的HPSG属性分析的新算法。(3) HPSG-谓词/变迁Petri网(Pr/T网)。(4)融合λ-抽象、λ-演算和HPSG的新方法。
其他文献
层状岩体是一种非均质、非连续、正交各向异性的力学介质,其变形主要受岩层组合和层面所控制。工程上普遍采用承压板法变形试验研究其变形特性,存在的主要问题是试验结果为等
作直方图是一项最基本的统计工作。过去多凭经验,或虽由计算机作出但未考虑如何达到最优。本文在总结作直方图的经验基础上构造出直方图最优分组数的一个综合定量评价指标,并编
本文以鞍山钢铁2012年财务报表分析为基础,与宝钢股份有限公司财务指标进行比较,对其偿债能力、盈利能力以及营运能力进行分析,寻找鞍钢股份发生亏损的原因,最后对其未来发展
目的:采用双黄连的组成药:金银花、黄芩和连翘的提取液为实验药物,并以利巴韦林为阳性对照药物,进行体外抗病毒实验。测试上述药物对甲3型(H3N2亚型)流感病毒诱导狗肾传代细
香港特区“双普选”指的是行政长官和全部立法会议员都通过普选产生,这是基本法为香港特区设定的政制发展目标。基本法同时规定,“双普选”必须根据香港的实际情况,按照循序渐进
横亘于中国大陆中部扬子陆块和华北陆块之间的秦岭造山带多年来一直是地学界研究的热点地区之一,历来为国内外学者所关注。自上个世纪90年代以来,随着对秦岭—大别造山带及其高
山西临县紫金山碱性杂岩体出露于吕梁山中段西翼,由于其典型的碱性岩岩石类型一直受到地学界的关注。论文对该杂岩体进行了详细系统地构造地质学、岩石学、岩石地球化学、同位
本课题受南方医科大学南方医院2005年度院长基金支助。一、立项背景及国内外研究现状胸部恶性肿瘤如肺癌、食管癌、乳腺癌等是我国最常见的恶性肿瘤,发病率呈逐年上升的趋势,是
本文以辩证唯物主义和历史唯物主义为基本指导思想,从民族传统文化的视角出发,探讨国共两党对中国传统文化的态度及传统文化对国共两党国家统一观形成的影响,进一步寻求国共两党
位于青藏高原南部高喜马拉雅和北部印度河-雅鲁藏布缝合带之间的特提斯喜马拉雅带是研究冈瓦纳大陆北缘拉张破裂、板块漂移和大陆拼合以及洋盆形成、演化和消亡等重要地质过