基于规则的现代汉语连词用法自动识别研究

来源 :第五届全国青年计算语言学研讨会(YWCL 2010) | 被引量 : 0次 | 上传用户:SANTACRUZ1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
连词能够连接词语、句子乃至篇章,具有特殊的连接功能,用法复杂多样。目前已有的连词研究成果大都是面向人用的,对连词用法的描述难以避免主观性和模糊性,很难直接应用于自然语言处理领域。本文采用“三位一体”的构建现代汉语广义虚词知识库的思想,给出了连词用法词典和用法规则库,并针对连词的连接功能,对连词用法的自动识别做出了不同于其他虚词的特殊处理。实验结果表明,这种基于规则的方法能够较好地用于连词用法的自动识别。
其他文献
在大句的范围内小句的组织结构会呈现某些特定的模式,即大句范式。而范式的运用存在着语种间的有无或常用罕用之别,需要在翻译时予以变换。迭句与花园幽径句都是汉语的常用大句
缩略语是几乎所有的语言中都存在的语言现象,它把必要的信息压缩到在接触的一瞬间就能立刻了解的程度,使语言的使用和表达更加的便捷和快速。由于缩略语本身具有的简洁、快速等
提出了一种中文句子修剪方法。引入噪音通道模型,经过改进,提出了更适合句子修剪任务的Bi—NC模型。 引入无导的方法,解决了中文中缺乏原句-压缩句对齐语料的瓶颈问题。提出
儿童免疫倡议及全球疫苗接种规划(特别专家顾问组推荐)第一部分:有关儿童免疫倡议(CVI)及全球疫苗免疫接种规划(GPV)的特别专家组(SAGE)于1997年6月11~13日在日内瓦召开了第二次会议。以下是该组对此次会议
多词语单元识别问题是目前计算语言学的研究热点之一。多词语单元是一个描述相对完整的若干词语组合,包括固定或半固定搭配。在语义块分析系统中,本文采用修改后的C-value方法
会议
西红柿同黄瓜一样,既可作蔬菜烹煮食之,也可作为水果生吃或凉拌食用。而与黄瓜不同的是:西红柿不能吃嫩的、未成熟的。成熟的西红柿才含有它应有的多种营养素。嫩西红柿中缺
期刊
普通话已经走过了近百年的历程,目前还很少有人对普通话的历时语音变化及其韵律特征进行系统的实验研究。本文以2005年颇具代表性的广播电视谈话体语料为基准数据,选取《现代汉
会议
中文信息处理用各种统计方法实现精度的提高,而规则的运用更多是在歧义和未登录词的研究上。蒙古语的统计方法发轫于近几年,但更多的是一种理念的进步,仍是以词干加附加成分的规
会议
生卒年月:1901年6月17日—1971年4月20日终年70岁最高职务:国民党中央组织部部长、国民政府内政部部长★张厉生留法归来,先入CC系,后转投陈诚集团,是陈诚手下得力干将,赴台后
本文根据目前已有的方位词研究成果以及已构建的现代汉语方位词用法词典和用法规则库,初步完成了对现代汉语方位词例句语料库的基于规则的用法自动识别,通过对自动识别结果的分