论文部分内容阅读
数量名短语的自动识别对用统计方法处理汉语将起到很重要的作用.本文主要是对顺序的"数·量·名"、量词重叠的数量名短语等常见的数量名短语形式自动识别方法的研究,提出了基于n个后字匹配的后退算法来发现更多的量名搭配,把召回率提高了40个百分点.我们在240万字的当代新闻小说语料上进行了识别试验和测试,结果显示,达到80%左右的调和平均值.