基于上下文相关字向量的中文命名实体识别

来源 :计算机科学 | 被引量 : 0次 | 上传用户:chaoschaos
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别(NER)旨在识别出文本中的专有名词,并对其进行分类。由于用于监督学习的训练数据通常由人工标注,耗时耗力,因此很难得到大规模的标注数据。为解决中文命名实体识别任务中因缺乏大规模标注语料而造成的数据稀缺问题,以及传统字向量不能解决的一字多义问题,文中使用在大规模无监督数据上预训练的基于上下文相关的字向量,即利用语言模型生成上下文相关字向量以改进中文NER模型的性能。同时,为解决命名实体识别中的未登录词问题,文中提出了基于字语言模型的中文NER系统。把语言模型学习到的字向量作为NER模型的输入,使
其他文献
针对陕西彬长文家坡矿业有限公司4106工作面运输顺槽巷道变形严重问题,设计采用锚杆+金属网/塑钢网+W钢带+锚索联合支护方案。在顺槽内布置2个测站,监测结果表明:巷道围岩顶
为解决采煤工作面超前支护工序繁琐、劳动强度大、工作面推进慢、巷道变形严重等问题,以工作面运输巷为工程背景,现场调研对巷道围岩支护进行分析,采用工程类比法分析提出超
为解决淋水巷道顶板稳定性差的问题,以潞宁矿22116运输巷为工程背景,对淋水巷道顶板失稳原因及其控制技术展开研究。结果表明:巷道顶板在水侵蚀作用下弱化,支护的承载性能衰
针对海天煤业下分层工作面过超高平行空巷存在的片帮、冒顶隐患,采用速凝早强高水充填材料进行充填,3 d强度2 MPa,配合高速制浆系统,实现快速充填,解决了工期紧张问题。效果
铁路文本分类对于我国铁路事业的发展具有重要的实用意义。现有的中文文本特征提取方法依赖于事先对文本的分词处理,然而面向铁路文本数据进行分词的准确率不高,导致铁路文本
基于马脊梁矿5127巷掘进期间应力区顶板蠕动变形严重,导致巷道顶板锚杆(索)支护失效、断裂、变形等现象,根据巷道原支护现状分析了蠕动变形区顶板支护失效原因,提出了耦合让
标记传播是使用最广泛的半监督分类方法之一。基于共识率的标记传播算法(Consensus Rate-based Label Propagation,CRLP)通过汇总多个聚类方法以合并数据各种属性得到的共识
法律判决预测是人工智能技术在法律领域的应用,因此对法律判决预测方法的研究对于实现智慧司法具有重要的理论价值和实际意义。传统的法律判决预测方法大都是只进行单一任务
蛋白质亚细胞的定位预测不仅是研究蛋白质结构和功能的重要基础,还对了解某些疾病的发病机理、药物设计与发现具有重要意义。然而,如何利用机器学习精准预测蛋白质亚细胞的位
目的检验中文版社会认知视频测查工具(Chinese version of the movie for the assessment of social cognition,MASC-C)在精神分裂症患者中测查心理理论的信度与效度。方法将