基于语法功能匹配的汉语句法分析算法

来源 :第九届全国计算语言学学术会议 | 被引量 : 0次 | 上传用户:jchenghai
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本文以语法功能匹配作为句法分析的基本方法,以100万词清华973树库作为语法功能调查的主要资源,实现了一种基于语法功能匹配的句法分析算法。该算法能有效减少伪歧义,具有良好的分析效率,其分析结果包含了丰富而准确的语法信息。实验表明,短语正确率与召回率在封闭测试和开放测试中分别达到75.17%、73.69%和65.06%、56.55%。
其他文献
本文认为,要构建高质量的健分词语料库亟需在现有的分词规范中着重补充以下三方面的内容:(1)命名实体(人名、地名、机构名)标注细则;(2)表义字串(数字、时间、日期、电子邮箱
会议
由于基于已切分语料的学习方法和体系的兴起,中文分词在本世纪的头几年取得了显著的突破。尤其是2003年国际中文分词评测活动Bakeoff开展以来。基于字标注的统计学习方法引起
会议
本文采用了目前汉语分词领域中一种优秀的分词方法-基于字的分词方法,通过实验的方式量化地探讨了在这一方法中不同的特征模板对于词表词和未登录词识别所起的作用。结果显示
工信部的最新数据显示,2011年上半年,全国进出口总额17037亿美元,同比增长25.8%;其中,出口8743亿美元,增长24%,增速比一季度回落2.5个百分点;进口8294亿美元,增长27.6%,增速
动词子语类框架(subcategorization frame以下简称SCF)在语义角色标注等方面的研究中具有不可或缺的重要作用。在子语类框架信息的获取过程中,首先要建立标准完备的子语类框
会议
给出了一种词性扩展与voting法结合的汉语组块识别方法(简称组合方法)。首先比较了特殊隐马尔可尖、SVM、CRF三种统计学习方法在组块识别上的效果。为了改善识别效果,对语料
基本短语,尤其是基本名词短语(BaseNP)一直是句法分析中需要特殊处理的一种结构。准确地识别基本短语不仅有助于降低句法分析的复杂度,提高效率;而且还能起到消歧的作用,从而
会议
含“的”字偏正结构的最长名词短语是汉语特有的一类最长名词短语。该短语的自动识别对于自动句法分析,机器翻译等自然语言处理系统都有重要意义。本文在考察其结构和分布特
维吾尔语是典型的黏着性语言。维吾尔语中动词修饰名词作定语有构形型和构词型两种变化,其中构形型有两种形态形式:动词的形动词形式+名词和动词的" "型动名词形式+名词,这种
“vp np的np”是汉语中普遍存在的一种句法结构,本文通过分析真实的语言环境中"vp np的np"的排歧因素,提出了基于最大熵的该句法结构排歧的方法。文中给出了特征的选择过程和