多语料库作法之中文姓名辨识

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:cdwkevin
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
专用名词虽然只占中文文章中的词的百分之一到百分之二,但是,如果不对这些专用名词加以处理,将会形成自动分词的错误的大部分。本文首先描述了包括中文姓名辨识的分词方法,然后介绍其实验结果。最后,文章讨论了中文姓名辨识被遗漏和误判的原因,并提出未来的研究方向。
其他文献
随着经济体制改革的深入,新品层出不穷,产品更新换代周期越来越短.新品在投入市场前,一般要进行新品专家鉴定会,以认定其技术水平,市场前景等,这是必要的.但是,笔者通过近两
新媒体时代的到来对传统电视新闻采编人员的专业素质和工作能力提出了更高的要求,但是从当前发展实际情况来看,电视新闻采编人员在工作的过程中存在多种多样的问题,不利于提
八十年代,条形码在许多领域得到应用。作为一种可印制的二进制语言,条形码也可用于中文信息处理。条形码汉字输入系统是依据汉字的国标码设计的,与一般的整字输入方法相比,有
《一个日内瓦居民给当代人的信》是圣西门第一部重要的著作,主要通过两封信、“朋友的意见”及复信表述了圣西门号召全人类到牛顿墓前认捐及建立牛顿会议的计划,具体阐述了如
期刊
据近期安徽家电市场显示:今夏国内电扇市场将盛行高档风、转页风、冷爽风、微型风.劲吹的“四风”将奏起电扇市场的主旋律.给炎热夏日撤下片片“绿荫”.高档风.从合肥城隍庙
本文论述了汉字字词库WB技术〔注〕在编码识别领域的应用、编码技术纳入WB汉字处理系统工程的原理、技术关键、主要技术指标及其综合社会效益。 WB 在兼容任何单字编码方案中
据有关部门报道,近来国外大量劣质电池流入我国,这些电池大多为普通民用电地、有的是我国在70年代中期已淘汰的糊式电池.这些电池外观漂亮,但质次价高,例如韩国红色tossiba牌
迄今为止,国内电子元器件的出厂质量水平都是用可接收质量水平(AQL)来表示的.供、需双方都以此为根据,并参照国标GB2828—81规定的抽样方案,决定一批产品的接收或拒收.但是在
本文在认真研究了英文字处理系统中回显算法的设计思想后,针对中文信息处理的特点提出了一种新的汉字文本回显算法,该算法以当前屏幕显示文本和修改后新的需显示的文本为已知