基于语料库的数量名短语识别

来源 :第三届学术计算语言学研讨会 | 被引量 : 0次 | 上传用户:laijiren_ruby1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数量名短语的自动识别对用统计方法处理汉语将起到很重要的作用.本文主要是对顺序的"数·量·名"、量词重叠的数量名短语等常见的数量名短语形式自动识别方法的研究,提出了基于n个后字匹配的后退算法来发现更多的量名搭配,把召回率提高了40个百分点.我们在240万字的当代新闻小说语料上进行了识别试验和测试,结果显示,达到80%左右的调和平均值.
其他文献
防是为了减少治,而治是为了更好的防.只有当防不住时,才采用治的方法.目前,采用的环流熏蒸杀虫技术进行治虫,效果很彻底,也很方便.如果能在这个基础上,切实做好防虫的工作,就
通过冬季通风降温、开春压盖密闭、高温季节膜下环流准低温储粮、夏季夜间通风降低仓温等措施,达到了低温储粮不用药;提供了当地排风扇降温适宜的单位通风量和降温幅度,总结
目的:观察针刀治疗神经根型颈椎病前后电生理指标变化,探讨针刀治疗神经根型颈椎病的可行性和有效性. 方法:①选择2002-08/2004-03南京军区福州总医院痛症科就诊的神经根
会议
本文主要研究了嗜卷书虱(Liposcelisbostrychophilus)以大米为食料的发育情况.在相对湿度为76%条件下,30℃时总发育期约27天;38℃时总发育期约26天,成虫全不产卵.在相对湿度88
贷款抵押作为金融机构防范信贷风险的一项措施,对于保全金融债权、维护金融机构自身权益有着积极作用。但笔者在对甘肃某市银行业贷款抵押情况调查后发现,无论是借款人以不动
大规模语料库中分词不一致现象普遍存在,并影响语料库的建设质量.在对熟语料进行分析统计的基础上,着重研究以"不"开头的双字结构,深入分析该结构分词不一致的产生原因.从全
通常词语在一定的语境下出现会更加确切表达其意思.不同的语境从不同侧面反映了词汇关系.本文利用语料库、释义词典、用户搜索日志作为识别相关词的语境,设计并实现了相关词
本文对1998年1月标注语料中具有多种切分形式的词进行了统计,发现1034个单纯的切分变异.在此基础上从不同层面分析切分变异的出现规律,得出大量的切分变异出现在低频词、二字
本文介绍了的设计与实现方法,并给出相关的算法流程图.其中详细分析了屏幕取词的关键技术--截获API函数的调用、鼠标钩子和判断鼠标所停留位置的单词.同时,给出实现蒙古文字
是为蒙古语语句的自动分析与自动生成而研制的一部电子词典.它是由总库及各分库所组成的.其各分库是的有机组成部分,(以下简称"字符分库")也包括在内.本文主要通过"字符分库"