关于句群SG的划分

来源 :北京师范大学,中科院声学研究所 | 被引量 : 0次 | 上传用户:sabot
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
语境单元与句群SG的对应原则是语境单元萃取SGUE八项原则的第一项原则,句群是HNC对段落、篇章处理时在句子和段落之间加上的一个过渡层次,对应到语言概念空间则可大体对应为语境单元SGU,句群在自然语言中没有约定的标记,难干划分,这也造成了语境单元萃取的困难。第一项原则的任务就是划定句群的范围,通过划定句群的范围即可确定对应的语境单元。因此在处理段落、篇章时,我们在语言空间先采用“虚跨逗号,暂停句号,参考分号、问号和叹号,立足于段落标记”的技术手段划分句群,而后根据语言概念空间的各句之间“主题”是否发生变化来最终划定句群。本文按照此思路,通过分析真实的新闻语料,来探索句群的划分。
其他文献
沈阳(2001)对汉语句法结构中论元名词短语的分裂移位现象进行了考察,提出了“分裂移位”的定义:当原来构成(或可构成)整体论元NP的组成成分在结构中分别独立存在,就是论元NP的分裂移位。从名词短语分裂移位的方向来看主要有两种情况,一种是后置论元NP分裂前移,另一种是句首论元NP分裂后移。本文只讨论句首论元NP分裂后移的条件以及句首NP分裂后移的句式成因。
要准确地把握两词相似义项的细微差异,最好的办法就是进行具体的比较、分析。副词“也”和“还”在许多语法书上都已经有过不少精辟的论述,本文主要想通过句法、语义、语用等方面,面向对外汉语教学,对“也”和“还”作一些具体的比较与分析,努力把握两者的细微区别,以期对留学生的虚词教学,尤其是“也”和“还”的教学提供有益的参考。
现代汉语范围副词“都”,也称“统括性副词”、“总括性副词”,是汉语中典型的充当状语的副词,一般用在谓语前,其语义所指范围一般都在它的前面。法语的“TOUT”及其变位形式“TOUTE,TOUS,TOUTES”(后简称TOUT)在很多情况下都可与“都”互译,在句法结构上不仅可充当状语,也可充当主语、定语、宾语和介词宾语。因此汉语的“都”在虚词中是母语为法语的学生学习的难点,除了“都”本身的语法特点外,
交互引擎的实现需要大量的形式化知识库提供支持,领域句类知识库就属于其中重要的一个知识库。领域句类知识库以领域句类表示式的方式将不同领域的世界知识提供给计算机使用,对提高句群一级的处理水平具有重大的意义。外交活动(节点a14)属于专业活动a行中政治活动领域概念林al下的一个重要领域概念树,它向上继承有政治领域al下的共同性领域世界知识,同时它还具有自身独特的外交领域世界知识。本文从外交活动概念节点所
被动句是英语与汉语的重要句式之一,也是汉英第二语言习得者学习的重要内容。在对外汉语教学中,母语对学习汉语所产生的干扰是一个不容忽视的问题。“被”与“by”在被动句中都可作介词,引出施动者,正是这个共同的语法功能提供了对比的可行性。但这两者的共同性也导致许多留学生把英语被动句中的介词“by”等同于汉语被动句中的“被”,从而引发了一系列理解与使用的错误。如误认为“被”与“by”即汉英被动句的标识词,滥
本文以2005年的1月1日至6月25日新浪网上下载的各类页面上的文本内容为研究资源集合,从中提取出有效词语,对词语的流行程度的判定属性做了定性定量的分析研究,对词语的流行特性进行了定义,在此基础上,引入衡量关注程度的量化方法,并配合依据词语判定属性与时间关系而绘制的走势曲线图,设置淘汰机制与评分机制,得到了候选流行词语,验证了流行词语判定属性规范的合理性,为机器辅助判定词语特性提供了参考数据。
汉语理解处理系统在将待处理语串与词库匹配后,会遇到单字的处理问题。HNC认为,应将剩余的单字进一步积字成词,这也就是动态词的识别问题。本文从理解处理的角度出发,说明了动态词和应登录词及专名的不同,并依据HNC理论的概念组合结构、特征语义块构成和动态词整体意义的不同,给出了动态动词和动态名词的主要类型。最后,简要介绍了字知识库对动态词知识描述的方法和内容。
有些动词在具体的语句中并不充当特征语义块或其构成成分,这种现象就是动词异化,相应的动词就是异化动词。动词异化在实际语言中较为普遍,对它的处理方法的研究有助于动词连见和动词团块的处理,也有助于提高句类分析系统的处理能力,是句类分析中的一个难点。HNC研究者已经提出了动词异化处理的若干规则,本文则在已有基础上对动词异化的处理做了进一步研究,提出了一批新的处理规则。这些新增的处理规则主要利用语境信息、对
本文以HNC理论为指导,结合语言学的语义指向理论,对“动词+助词或趋向动词+形容词”的语义结构进行分析,归结出多种类型,描述了各种类型的特点,并探讨了在HNC句类分析系统中对这些语义结构类型进行判别的基本策略。
Ek并列式与组合式构成在语言表层都表现为由两个或多个动词联合起来共同组成句子的特征语义块,需要深入研究它们的构成特点,找出区别,以便于识别。本文研究了这两种构成形式的特点,分析了它们的区别,探讨了在HNC语句理解处理框架下对它们进行识别的方法。