【摘 要】
:
中文机构名自动识别是命名实体识别的重点和难点,目前各种解决方案的实际效果还难以满足人们的实际需求。本文提出了一种基于角色标注的中文机构名自动识别方法,其基本思想是
【机 构】
:
中国科学院计算技术研究所软件研究室;
【基金项目】
:
国家重点基础研究项目(G1998030507-4:G1998030510);计算所领域前沿青年基金项目20026180-23资助
论文部分内容阅读
中文机构名自动识别是命名实体识别的重点和难点,目前各种解决方案的实际效果还难以满足人们的实际需求。本文提出了一种基于角色标注的中文机构名自动识别方法,其基本思想是:根据在机构名识别中的作用,采取Viterbi算法对切分结果进行角色标注,在角色序列的基础上,进行字符串识别,最终实现中文机构名的识别。识别过程中我们只需要某个词作为特点角色的概率以及角色之间的转移概率。该方法的实用性还在于:这些角色信息完全可以从真实语料库中自动抽取得到。通过对大规模真实语料库的封闭测试中,该方法取得了接近90%的召回率和准确率,即使在开放测试中,准确率也高达88%。不同实验从各个角色表明:基于角色标注的机构名识别算法是行之有效的。
其他文献
兴义地区某110kV变电站110kV系统采用内桥接线的主接线方式,且只配置两条进线三相电压互感器、未配置母线电压互感器的接线方式。二次部分配置了电压并列装置,母线电压由进线电
讲解员被视为"形象的代表",应有较高的、较为规范的仪态要求.讲解员的仪态要落落大方,站、坐、行都要有度.学习礼仪,运用礼仪,将有益于讲解员更好地充当所在景区的形象大使.
目的:探讨翼状胬肉切除术后胬肉复发的危险因素并构建复发概率风险预测模型。方法:对翼状胬肉切除联合角膜缘干细胞移植术治疗的72例翼状胬肉患者的临床资料进行回顾性分析,
夏季总会有一些宝宝无缘无故地出鼻血,宝爸宝妈们看到自己的宝宝鼻出血总是吓坏了,不知所措。不禁要问,宝宝为什么会鼻出血呢?更重要的是,宝宝出现鼻出血应如何科学、快速、有
目的对老年骨科患者的护理方法进行探讨。方法选取我科86例住院治疗的老年骨关节疾病患者,将其随机分为对照组和实验组,对两组患者分别进行我科现存护理模式和临床健康宣教护
水松原纸是卷烟行业作为固定过滤嘴的外层包皮纸,并起到一定的卷烟装饰作用,原纸经过涂布加工印刷后就成为水松纸.
基于S1000D规范编制电子技术手册是目前电子手册发展趋势;为促进S1000D规范在以信息化为中心的综合保障技术中的应用.提高技术资料的使用性和经济性,在研究了S1000D规范下IPC数
桃树流胶病是秦安县桃树园中常见的一种病害,流胶病发生在根颈、主干、枝杈等部位。桃树流胶的成因有许多,不仅与天气温湿度、栽培管理有关,而且与树龄、树势等因素有关。要
摘要:根据典型轴类零件的加工工艺特点,采用了驱动顶尖与尾台顶尖配合的双顶尖结构夹持轴类零件的新方案.提高了轴类零件加工精度和加工效率。针对此种夹持方式,在自动线上下料时
酒店管理专业学生的形体训练,主要是以人体结构以及科学为基础,采用徒手或者器械练习方式,对身体、仪态仪表有机形态进行培训,从使酒店管理专业的学生个人素养得到快速的提高