基于transformer的python命名实体识别模型

来源 :计算机应用 | 被引量 : 0次 | 上传用户:luyan135
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
最近一些基于字符的命名实体识别模型无法充分利用词信息,而利用词信息的格子结构模型可能会退化为部分基于词的模型而出现分词错误,针对这些问题提出了一种基于transformer的python命名实体识别模型来编码字符-词信息。首先将词信息与词开始或结束对应的字符绑定,然后利用三种不同的策略,将词信息通过transformer编码为固定大小的表示,最后使用条件随机场解码,从而减轻获取词边界信息带来的分词错误问题,提升批训练速度。在python数据集上的实验结果可以看出所提模型的F1值比格子结构模型高2.6
其他文献
针对Dropout的流动性和随机性可能引起欠拟合或过拟合的问题,提出跨信道计算注意力权重并掩盖注意力权重最大区域的正则化方法(MARDrop)。首先,设计跨信道注意力权重提取机制,提取所有特征图的注意力权重,并筛选出注意力权重较大的部分作为特征判别单元。然后,根据特征判别单元周围区域的注意力权重变化确定出注意力权重最大区域,并将其掩盖即置对应区域为0,其余区域均置为1。最后,将取值为1的注意力权重
期刊
针对超高清产业中高分辨率资源较为匮乏的问题,视频超分辨率是一项很有实用价值的工作。为了有效利用视频序列帧间丰富的时间相关性信息及空间信息,提出一种基于多尺度时域3D卷积的视频超分辨率重建算法。该算法将输入的低分辨率视频序列帧分别通过不同时间尺度的3D卷积进行时空特征提取,3D卷积由于其3维卷积的特性相较于2D卷积更加适用于视频任务的处理,通过不同尺度时域下提取的两种时空特征自适应运动补偿后,由亚像
期刊
锆石是各种岩石中常见的副矿物,不仅是最佳的定年矿物,且其微量元素、同位素还记录岩石形成演化过程的大量信息.关于地幔橄榄岩等超基性岩中出现锆石的报道越来越多,但通常认为超基性岩SiO_2不饱和,不太可能结晶锆石,导致其成因和来源常受质疑.本文通过热力学相平衡模拟,计算不同条件下岩石的SiO_2活度与锆石/斜锆石转变条件,以探讨SiO_2活度的受控因素、锆石/斜锆石在超基性-基性岩特别是地幔橄榄岩中的
期刊
以我国北方地区天津武清、山西晋中、辽宁沈阳和内蒙古乌兰察布等地的典型设施菜地土壤为研究对象,分析设施蔬菜种植过程中土壤稀土元素的变化特征,尝试利用稀土元素特征值示踪、表征人类活动对土壤生态环境干扰的可行性。结果发现,辽宁沈阳设施菜地表层土壤中稀土元素总量(REE)范围为146.52~158.76mg·kg~(-1),均值为152.34 mg·kg~(-1);天津武清区设施菜地表层土壤中稀土元素总量
期刊
紫外波段是星系能谱分布中的重要部分.其包含大量原子、离子和分子的共振线以及研究重要物理过程的连续辐射,提供了理论研究重要的观测限制.在星系研究中,紫外辐射追踪大质量恒星,是测量和理解宇宙中恒星形成历史的重要工具.紫外辐射也可追踪大质量黑洞吸积盘,是理解吸积物理过程的重要手段.其涉及的关键科学问题包括宇宙正午时期的恒星形成历史与星系演化、宇宙重子物质缺失、宇宙再电离能量来源以及星系吸积和外流反馈等.
期刊
运动视频中特定运动帧的获取是运动智能化教学实现的重要环节,为了得到视频中的特定运动帧以便进一步地对视频进行分析,利用姿态估计和聚类的相关知识,提出了一种对运动视频提取特定运动帧的方法。首先选用HRNet姿态估计模型作为基础,该模型精度高但模型规模过大,为了实际运用的需求,对该模型进行轻量化处理并与DARK数据编码相结合,提出了Small-HRNet网络模型,在基本保持精度不变的情况下参数量减少了8
期刊
属性值约简是粗糙集理论的核心问题之一,也是数据挖掘和知识发现领域中,基于专家系统构建规则提取算法与归纳规则分类器的重要技术基础。针对现有属性值约简模型程序复杂,难以实现,并且所提取的关键信息往往过于追求简明,而削弱决策系统表达能力这一问题,提出一种基于确定性因子的启发式属性值约简模型。首先,构造几种不同性质的属性集工具,并给出其相关定理及证明,同时开发一种约简信息函数,实现为约简属性赋值;然后,将
期刊
针对深度强化学习算法在复杂动态环境中训练时,由于环境的部分可观测性原因导致智能体难以获得有用信息而不能学习到良好策略且算法收敛速度慢等典型问题,提出一种基于LSTM和非对称actor-critic网络的改进DDPG算法。该算法在actor-critic网络结构中引入LSTM结构,通过记忆推理来学习部分可观测马尔可夫状态中的隐藏状态,同时在actor网络只使用RGB图像作为部分可观测输入的情况下,c
期刊
钠离子电池因其资源丰富、环境友好等优点成为最有可能代替锂离子电池的新一代储能体系.然而,具有高容量、长循环稳定性的负极材料的缺失成为阻碍钠离子电池发展的关键.金属硒化物具有理论容量高、安全性好以及形貌容易设计等优点,已经逐渐成为新一代钠离子电池负极的潜在替代材料.然而,金属硒化物本征电导率低,导致其循环稳定性较差,一般需要通过形貌设计或掺杂、复合等方式进行改善.本文介绍了近年来多种金属硒化物在钠离
期刊
不同框架深度学习模型部署是人工智能落地的核心,然而模型计算量和参数量过大、编程模型未统一导致了各种新型的专用卷积神经网络(CNN)加速器层出不穷,增加了模型的部署难度。对模型压缩和编译工具链这两个方面进行了改进:在模型压缩方面,提出了新的通道剪枝标准,结合了通道的相关性和影响性以及输出通道对应的激活值,在保证精度的同时可以极大地削减卷积神经网络的计算量和参数量;在编译工具链方面,设计了一套自动的端
期刊