【摘 要】
:
命名实体识别是自然语言处理的一项基本技术,它是信息抽取、信息检索、机器翻译、组块分析、问答系统等多种自然语言处理技术的重要基础。因此对命名实体识别的研究具有较高
论文部分内容阅读
命名实体识别是自然语言处理的一项基本技术,它是信息抽取、信息检索、机器翻译、组块分析、问答系统等多种自然语言处理技术的重要基础。因此对命名实体识别的研究具有较高的实用价值。命名实体识别任务主要是识别文本中的人名、地名、机构名等实体,我们在第二章中分析了三类实体的语言学特点,介绍了目前的命名实体识别的主要方法和系统,在第三章中介绍了图模型和条件随机场,为后面的工作打好基础。命名实体识别任务常常转化为序列标注的问题,而条件随机场是一个统计序列标注模型,具有很强的特征融合能力,已经被成功的应用到了自然语言处理的很多领域中,基于条件随机场的方法是目前命名实体识别任务的常用方法。特征是影响命名实体识别性能的重要因素,由于命名实体识别任务中可用到的特征很多,这些特征包括位置特征、词性特征、内部组成特征、外部引导特征、实体资源列表特征及其子类,它们的组合数量更是成指数增长,因此选取合适的特征及其组合是提高性能、节省模型训练时间的重要途径。各类特征以资源列表的形式存在,资源列表的丰富性与准确性对识别性能有至关重要的影响,本文提出了一种基于互信息的方法,从标注语料中自动获取资源列表。基于字和基于词的命名实体识别是两种基本框架,本文在这两种框架下比较了特征及其组合对命名实体识别性能的影响。本文最后实现了一套命名实体识别系统,根据前面的特征选择实验,在统一的框架下进行三类实体的识别,并给出了封闭测试和开放测试结果与分析。
其他文献
沼液是由人畜粪便、农作物秸秆等各种有机物经过厌氧发酵后的残余物,含有丰富的植物生长必需的大量和微量元素,各种水解酶等生物活性物质,以及对病虫害有抑制作用的物质,是优
<正>在移动互联网爆发的年代,"拇指一族"的消费受到商家更多关注。近日,一款名为"出柜"的APP软件受到热捧,而推出此软件的正是国内时尚箱包电商麦包包。与许多手机客户端不同
<正>良好的饮食习惯是培养幼儿独立生活自理能力的开端,它有利于食物的消化和吸收。但是,长期以来,幼儿不良的饮食习惯一直困扰着家长和幼儿园教师,其主要表现为:不主动进餐
努力改善职工工作环境李佳铭职工工作环境的改善是我们企业建设的一个组成部分,它是体现我们党和国家关心职工生活、工作,让他们得到实惠的具体体现,也是增强职工凝聚力,保一方平
本文通过对310名在校大四学生职业选择问卷调查,分析了当代大学生职业选择情况的主客观影响因素,研究了选择公务员与企业职员两类职业同学的情况、这两类职业选择之间转换的
我国企业会计环境的复杂性,使得会计政策的选择呈现多样性.会计政策选择的恰当与否直接影响着企业的发展方向.本文从会计政策的含义、特点、会计政策选择的意义及客观必然性
广西小城镇的水环境问题日益突出,对小城镇的污水治理势在必行。本文是在广西小城镇污水处理科研的基础上对广西小城镇污水的特点、处理要求进行了分析,对六种污水处理工艺的
目的:研究海参多糖(PSU)对大鼠急性不完全性脑缺血(AICI)损伤的保护作用及抗凝血作用。方法:SD大鼠60只,随机分为5组(n=12):假手术组、模型组、海参多糖低(30 mg/(kg.d))、中(60mg/(kg.d))、高
为了研究高水分玉米发酵后制作配合饲料对民猪生长及肉质的影响,试验以发酵玉米替代常规饲料中干玉米生产猪配合饲料,研究其对民猪生长性能、胴体性能和肌肉品质等指标的影响