【摘 要】
:
口语依存树库的建设不但可以满足统计自然语言处理的需要,也有助于基于语料库的句法研究.口语具有无意识地反复、成分残缺等特点,对其各成分之间依存关系的研究有助于我们更
【机 构】
:
中国传媒大学应用语言学系 北京 100024
论文部分内容阅读
口语依存树库的建设不但可以满足统计自然语言处理的需要,也有助于基于语料库的句法研究.口语具有无意识地反复、成分残缺等特点,对其各成分之间依存关系的研究有助于我们更好地发现言语交际过程中的特点与规律,有助于把握口语和书面语之间的异同.本文着重对汉语口语树库标注过程中遇到的一些特殊结构问题,如口语中的重叠、反复、是+谓词性成分、A不A/A没A等进行了讨论,并在参考前人观点的基础上,提出了相应的处理方法.
其他文献
动词子语类框架(subcategorization frame以下简称SCF)在语义角色标注等方面的研究中具有不可或缺的重要作用。在子语类框架信息的获取过程中,首先要建立标准完备的子语类框
给出了一种词性扩展与voting法结合的汉语组块识别方法(简称组合方法)。首先比较了特殊隐马尔可尖、SVM、CRF三种统计学习方法在组块识别上的效果。为了改善识别效果,对语料
基本短语,尤其是基本名词短语(BaseNP)一直是句法分析中需要特殊处理的一种结构。准确地识别基本短语不仅有助于降低句法分析的复杂度,提高效率;而且还能起到消歧的作用,从而
含“的”字偏正结构的最长名词短语是汉语特有的一类最长名词短语。该短语的自动识别对于自动句法分析,机器翻译等自然语言处理系统都有重要意义。本文在考察其结构和分布特
维吾尔语是典型的黏着性语言。维吾尔语中动词修饰名词作定语有构形型和构词型两种变化,其中构形型有两种形态形式:动词的形动词形式+名词和动词的" "型动名词形式+名词,这种
“vp np的np”是汉语中普遍存在的一种句法结构,本文通过分析真实的语言环境中"vp np的np"的排歧因素,提出了基于最大熵的该句法结构排歧的方法。文中给出了特征的选择过程和
本文以语法功能匹配作为句法分析的基本方法,以100万词清华973树库作为语法功能调查的主要资源,实现了一种基于语法功能匹配的句法分析算法。该算法能有效减少伪歧义,具有良
以巴西橡胶“热研7-33-97”古铜期嫩叶为材料,采用酶解去壁低渗法来制备中期染色体标本,及利用显微分离方法随机分离橡胶树单条染色体,分离后的单染色体分别用接头引物介导PC
非胰岛素依赖型糖尿病亦称2型糖尿病(NIDDM),是以胰岛素作用不足或胰岛素抵抗为主要特征,由遗传和环境因素相互作用而引起的临床综合征。其发病机制较为复杂,至今尚未完全明
本文采用MaltParser和哈工大汉语依存树库进行了基于树库的汉语依存句法分析实验,目的在于发现影响依存句法分析精度、效率和连通性的因素.实验结果表明,POS使得用小训练集也