基于转换的错误学习方法在中文分词后处理中的应用

来源 :第七届中文信息处理国际会议 | 被引量 : 0次 | 上传用户：liangmin888

【摘要】

：

为研究基于转换的错误学习方法(TBL)以后处理方式提高分词精度的问题,分别用FMM和HMM两种初始分词器,在SIGHAN 2006 MSRA和UPUC语料上试验了基于字的一元、二元、三元及其组

【作者】

：

何楠[1]毛新年[2]董远[3]王海拉[2]

【机构】

：

北京邮电大学信息工程学院,北京,100876

【出处】

：

第七届中文信息处理国际会议

【发表日期】

：

2007年期

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

为研究基于转换的错误学习方法(TBL)以后处理方式提高分词精度的问题,分别用FMM和HMM两种初始分词器,在SIGHAN 2006 MSRA和UPUC语料上试验了基于字的一元、二元、三元及其组合等九套模板.结果表明在复合模板中包含基于字的二元模板比不包含的效果好,而一元二元复合模板效果最好且在初始精度很高的情况下仍带来明显性能提升,使HMM在SIGHAN 2006 MSRA开放测试上的名次由第六位上升到第三位.同时在上述九套模板上进行了基于规则数目和规则得分的裁剪实验,结果表明平均使用9.45％的规则就能达到85.947％的性能提升.

其他文献

脑、脊髓、颅神经根骨多发病变PET/CT鉴别诊断一例

期刊

多媒体玉米病虫草害诊治专家系统的应用

本文利用农业生产知识、计算机和网络技术,研制开发了行之有效的多媒体玉米病虫草害诊治专家系统,将数据库、人工智能、管理信息系统、决策支持系统、网络技术以及信息集成技

会议

玉米病虫草害诊治专家系统多媒体技术

柳钢100t LF钢包精炼炉生产实践

根据LF炉生产、工艺、设备的特点,建立了适合柳钢实际的LF炉生产模式；对LF炉的生产设备进行了整改,使得其更好的服务于生产；为了能够更好的实现LF炉的升温、脱氧、去夹杂的功能

会议

柳钢钢包精炼炉生产设备生产模式生产工艺去夹杂优化脱氧功能服务

红色的山乡教师——张瑾瑶

一九五二年,张瑾瑶从人民解放军转业回到故乡山西平定县,当了山区小学教师。他根据党的教育方针,在神峪口办起了小学,艰苦办校十二年,培养了一百二十三个初小毕业生,开展业

期刊

小学教员业余教育小学教师就这样教育方针百二毛主席平定县拾孩子想着

我国城市科技投入绩效评价模型构建方法初探

作为一种政府公共资源,准确评价科技经费的投入绩效,是提高政府投入效率、规避政府投入风险的需要,也是世界各国的普遍做法.通过对科技投入效益进行全面而准确的评价,对增加

期刊

城市科技投入绩效评价模型构建经济增长和社会发展政府资源投入效益投入效率投入绩效投入风险世界各国科技经费科技产出技术进步公共资源高科

油汽蒸汽回收工业撬装装置新技术的研究与开发

《工业企业设计卫生标准》TJ36-79,要求对油汽蒸汽生产中产生的可燃性气体进行回收利用,这就需要研制与开发出既经济又实效的VOC回收装置,装置应具有工艺流程简单、设备少、

会议

一种基于规则的中文分词算法

本文提出了一种基于词库的结合词频、词性、中文文法规则和未登录词识别规则的分词算法,该算法首先通过采用基于词库的跨度为1的前向最大匹配分词算法获得初步的分词结果,然

2009地产年度之最

政策保八国家统计局新闻发言人李晓超早前宣布,我国前三季度GDP增长率达到7.7%,经济回升趋势得到巩固,加之去年四季度基数较低,“‘保八’是有把握的,是没有悬念的。”这得益

期刊

一揽子计划李晓超社会保障水平地产新闻发言人中国馆早前国家统计局楼盘楼市

绝热气动管道平均摩擦系数的计算新方法

在汽车制造、电子、工作机械(纺织机械、印刷、包装设备、机床)、食品等工业产业的自动化进程中,气动技术发挥着重要的作用。为了设计出优化的气动系统,需要准确地把握每个气

会议

HIsmelt工艺与富氧顶吹熔融还原冶炼技术

本文主要介绍了HIsmelt炼铁工艺和由昆明理工大学自行开发设计的富氧顶吹熔融还原冶炼工艺.此二种熔融还原炼铁工艺具有相同点,但又有很多不同点.工艺中均采用高二次燃烧率,

期刊

HIsmelt富氧顶吹熔融还原工艺高磷铁矿

基于转换的错误学习方法在中文分词后处理中的应用

与本文相关的学术论文