基于底表的多层扫描术语自动标注算法

来源 :厦门大学学报(自然科学版) | 被引量 : 0次 | 上传用户:mingxing10192009
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
以学科教材术语语料库建设为目标,实现了一种基于底表的多层扫描术语自动标注算法.该算法首先采用预测性规则模板扫描文本中未登录术语,并进行标注;其次采用最大匹配方法识别出每个可能的候选术语,把每个候选术语看作术语的定位点,扫描其上下文语境,分别调用单位术语规则模板、例外规则、部件规则、部件例外规则、例外校正规则等对扫描结果进行判断,确定候选术语的身份,并进行标注.该方法以规则的预测和限定功能为辅,充分利用了底表术语信息,取得了较高的标注准确率和召回率,开放测试F-指数达到了84%左右.
其他文献
科索沃问题由来已久,其宣布独立有着深刻的历史背景和复杂的社会原因。塞尔维亚出于对国家主权的维护向联合国大会提交申请,后者通过决议继而向国际法院提交了“科索沃单方宣
<正> 人们通常以为考古学家很少在半空中进行考古而更多的是手持铁锨挖掘于地面之上,并会想起那些包括特洛伊古城的发现者德国人海因里希·施里曼和因发现图坦阿蒙法老陵墓而
期刊
随着中国市场的不断开放,越来越多的跨国贸易公司想要进一步扩大在中国的市场和规模。然而很多外国企业在刚刚进入中国市场时,不重视广告的作用,简单的将产品在本国的广告策
钠硫电池具备低电压、大电流的特性,储能变流器(PCS)的接入具有一定的挑战,此处采用双级式PCS有效解决接入问题。前级DC/DC变换器提高直流母线电压,釆用六相交错并联技术,有
法律权利是一个重要的法律概念,也是一个有着高度争议性的概念,自近代以来,针对法律权利,在法律理论上就一直存在着“意志论”与“利益论”的争辩。构成争论实质的是法律规范
本文从人力资本会计的内涵出发,阐发了人力资本会计的重要作用,分析了人力资本会计信息披露的困境,并从产权制度、现行的人力资本会计理论不完善、人力资本的特殊性及其公开
采用动态轴重仪的高速公路收费站,经常由于收费纠纷、车型检测错误、称重设备损坏不能进行称量等原因造成车辆的拥堵,究其原因是称重设备的称量精度不高、车型识别率不高、易损
本文概述了图像压缩编码所涉及的基础理论知识,包括图像压缩编码的基本原理、压缩方法和编码算法等;同时还介绍了图像压缩的判别标准和一些常用的涉及图像或视频压缩的国际标
通过对乙炔工段电石渣浆系统进行改造与优化,将电石渣浆澄清水全部回收利用,实现了工业废水零排放。节约了水资源,降低了生产成本,取得了显著的环保效益和经济效益。
中国特色社会主义制度的发展就是要实现制度的现代化,制度现代化表现为治理体系和治理能力的现代化,动力来自于改革的深化和发展,只有通过改革才能实现国家治理现代化,促进中