基于深度学习的命名实体识别综述

来源 :中文信息学报 | 被引量 : 0次 | 上传用户:pingguotailang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
命名实体识别是自然语言处理的基础任务之一,目的是从非结构化的文本中识别出所需的实体及类型,其识别的结果可用于实体关系抽取、知识图谱构建等众多实际应用.近些年,随着深度学习在自然语言处理领域的广泛应用,各种基于深度学习的命名实体识别方法均取得了较好的效果,其性能全面超越传统的基于人工特征的方法.该文从三个方面介绍近期基于深度学习的命名实体识别方法:第一,从输入层、编码层和解码层出发,介绍命名实体识别的一般框架;第二,分析汉语命名实体识别的特点,着重介绍各种融合字词信息的模型;第三,介绍低资源的命名实体识别,主要包括跨语言迁移方法、跨领域迁移方法、跨任务迁移方法和集成自动标注语料的方法等.最后,总结相关工作,并提出未来可能的研究方向.
其他文献
光伏发电功率预测是光伏发电规划和电网经济运行的重要基础.针对K-means算法无法确定最佳聚类数和聚类结果不稳定的问题,以及GBDT(梯度提升树)预测结构简单、预测精度低的缺点,提出集成聚类和XGBoost的组合预测算法用于构建短期光伏发电功率的预测模型.首先,采用Mean-shift(均值漂移算法)、凝聚层次聚类算法和DBI(戴维森堡丁指数)优化K-means算法,解决了无法确定最佳聚类数和聚类结果不稳定的问题;其次,在集成聚类得到的聚类结果数据上,训练得到不同气象类型下的XGBoost预测模型,以此来
针对构建朝鲜语语料库的人工标注工作过于费时费力,少数民族语言难以与各家资源融合的这一问题,该文从表征学习的角度,意图构建有效的朝鲜语句子结构表示,用来提升后续自然语言处理任务的效果.我们将深度强化学习与自注意力机制相结合,提出了一种分层结构的自注意力模型(Hierarchically Structured Korean,HS-K).模型利用强化学习中的Actor-Critic思想,将文本分类效果作为强化学习的标签反馈信息,把文本的结构划分任务转化为序列决策任务.实验结果表明,模型可以识别出接近人工标注的朝
老挝语是一种无空格切分的字母语言,在进行自然语言处理工作时需要首先进行分词处理.现有分词算法主要为首先使用规则进行音节切分,然后根据音节切分结果进行老挝语分词,存在错误传递等问题.该文提出一种基于神经网络的端到端老挝语分词方法,基于多任务联合学习思想,将老挝语音节切分与分词工作进行结合,实现了基于双向长短时记忆循环神经网络(BiLSTM)的端到端老挝语分词模型.实验表明,端到端的老挝语分词模型准确率达到89.02%,较以往分词模型有所提升.
公开(公告)号 : CN112704867Arn一种拥有多个独立气囊的充气轮滑鞋,其特征在于,所述轮滑鞋的上面设置有弹性很小的鞋帮;鞋帮左右侧分别设置有卡齿条和卡齿套;鞋帮的中间设置有轮滑鞋拉链,轮滑鞋拉链上设置有轮滑鞋拉链头;鞋帮上端的前后分别设置有前粘带和后粘带;所述鞋内套的前面设置有内套拉链;内套拉链上设置有内套拉链头,内套拉链头上设置有拉条;鞋内套的前面设置有前主气囊,前主气囊固定在内套拉链的一条边带上;前主气囊的顶部设置有气门;后主气囊固定在鞋内套的后部,后主气囊上面设置有气门.
期刊
路径选择是知识库问答任务的关键步骤,语义相似度常被用来计算路径对于问句的相似度得分.针对测试集中存在大量未见的关系,该文提出使用一种负例动态采样的语义相似度模型的训练方法,去丰富训练集中关系的多样性,模型性能得到显著提升.针对复杂问题候选路径数量组合爆炸问题,该文比较了两种路径剪枝方法,即基于分类的方法和基于集束搜索的方法.在包含简单问题和复杂问题的CCKS 2019-CKBQA评测数据集上,该方法能达到较优异的性能,测试集上单模型系统平均F1值达到0.694,系统融合后达到0.731.
SKU占比rn在4月运动休闲款式的色彩占比中,白色依旧是最重要的色彩之一,占据25%的比例,可在白色的鞋款上再点缀其他色彩;其次是比较质朴的米色、粉色以及蓝色系;进入夏季,黑色在4月更多的是做为搭配色存在.在品牌的维度中,客户浏览热度以及下载热度主要集中在NEW BALANCE、LI-NING、Adidas、Nike以及FILA等运动品牌上.在款型上,老爹鞋与跑鞋的占比不相上下,板鞋也是主要的款型之一.
期刊
随着人工智能和大数据处理技术的发展,人工智能技术在辅助法官办案、辅助诉讼、辅助司法管理等诸多方面起着重大作用,推进了智慧法院的发展,并受到学术界及工业界的广泛关注.该文在针对人工智能技术在辅助司法办案相关模型分析的基础上,归纳并提出了目前司法判决预测领域存在的多特征的罪名分类预测、多标签的罪名分类预测、司法判决预测中多个子任务处理、司法判决预测中的不平衡数据处理、判决预测结果的可解释性以及将已有的刑事案件预测算法迁移学习推广到不同类别案件等6项关键性问题与挑战.同时,该文针对这些关键问题与技术挑战进行了理