基于BERT-FLAT-CRF模型的中文时间表达式识别

来源 :软件导刊 | 被引量 : 0次 | 上传用户:viagra2
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
时间信息识别是自然语言处理中非常重要的任务。传统中文时间表达式识别中常用的机器学习方法需构造大量特征模板,词向量为单一向量,不具有多义性,且难以获取长距离依赖。针对这些问题提出BERT-FLAT-CRF深度学习网络架构,利用Bert提升词向量表达,FLAT融合时间词汇特征,最后通过CRF提取最优序列标注。在TempEval-2语料中取得93.12%的准确率和92.15%的召回率,均优于其它算法模型,在自建数据集中与其它深度学习模型相比,该方法同样具有较好的效果,可有效提升对中文时间表达式的识别能力。
其他文献
绿色印刷概念早已提出,并在学生教科书等领域陆续开展相关认证工作,但在2021年之前还未曾应用于报纸印刷企业。2021年6月3日,中国质量认证中心与中国报业协会联合举办了党报绿色印刷首批获证单位授牌仪式,标志着报纸行业开始迈入绿色印刷的行列。本文重点围绕报纸行业绿色印刷认证相关管理制度进行解析。
人脸识别技术使用时容易受到伪造攻击。针对这一问题,提出一种基于双目视觉获取人脸深度信息,再结合层次分析法实现活体检测的方法,并应用树莓派研制活体人脸识别装置。该装置首先对双目图像进行对应点立体匹配,获得人脸图像的三维深度信息;然后选取人脸特征点,以鼻尖为参考点计算特征点与鼻尖点的深度差值;最后针对真实人脸和伪造人脸的三维特征,对各深度差值赋权,从而构建人脸深度特征以判断是否为活体人脸。实验结果表明
本文从船舶和港口两个方面分析了原油卸货短重的一些常见原因,并提出了相应的控制措施,以期能更好地促进原油贸易健康发展,维护各方利益。
利用多标签机器学习对多功能蛋白质进行分类预测是目前比较好的方法。随机k标签分类算法(RAkEL)采用将所有标签按k长度随机划分进行分类预测。虽然该方法考虑到了标签之间的相关性,但是随机k标签划分时会产生大量冗余标签,增加了分类器计算量。对传统的随机k标签分类学习算法进行改进,加入Apriori算法对标签进行关联规则挖掘,将得到的关联规则进行标签划分,然后运用集成LP算法进行模型训练,从而得到最终模型,最后以最终模型进行标签分类预测。运用改进的多标签分类学习算法对多功能酶(一种多功能蛋白质)进行分类预测,并
在研究语音识别关键技术基础上,将深度神经网络模型应用于语音的关键词检索任务上,提出基于深度神经网络的语音关键词检测模型。与基线GMM-HMM模型进行对比实验,结果表明:LSTM模型的训练参数大小为436570,DNN的训练参数为698100,Gaussiam混合模型(GMM)的训练参数大小为1226760。基于LSTM-HMM和DNN-HMM模型的语音识别准确率分别为96.5%和91.6%,显著高于传统语音识别模型(GMM-HMM)的78.5%。基于LSTM-HMM模型的语音识别技术具有较高的准确率,更适
市场监管部门是推动国家质量基础设施建设的重要责任主体。近年来,湖州市市场监管局以提高质量和效益为中心,开展质量提升行动,不断推动标准、计量、合格评定等质量基础设施建设,努力打造湖州质量基础设施建设高地。构建现代先进测量体系夯实制造业质量控制基石展望“十四五”时期计量发展新趋势。党的十九大报告明确提出,要“加快建设制造强国,加快发展先进制造业”。习近平总书记多次强调,“制造业高质量发展是我国经济高质量发展的重中之重”。
为了解决传统人工势场法存在的目标不可达、易陷入局部极小值问题,在传统人工势场法基础上提出改进后的人工势场法.针对目标不可达问题,当目标点在附近障碍物影响范围内时,通
随着电力市场改革的不断深入,需求侧资源参与电力市场将促进高比例新能源接入并推动竞争型零售电力市场发展,为电力系统的经济可靠运行提供更有效的保障.首先分析了需求侧资
非刚性运动结构的三维重建旨在从二维图像中提取出关键坐标,并恢复其对应的三维形状及姿态。然而,目前的传统方法无法在大规模场景中应用。为此,将卷积神经网络应用于非刚体运动的三维重建中,提出一个基于无监督学习的非刚体三维重建框架。在FacebookAI实验室提出的C3DPO基础上,选择iResNet为backbone,并采用Ranger优化器进行训练。实验结果表明,该框架不仅可以更快地收敛,而且在H36
为提升文本关键词提取准确率和效率,提出一种基于LightGBM的文本关键词提取方法。该方法通过TF-IDF提取候选关键词,利用Word2Vec计算词向量,并采用特征工程,对候选关键词进行特征提取,再经由LightGBM算法将关键词提取转换为二分类问题。通过实验对比TF-IDF算法、TextRank算法、LDA算法及LightGBM算法对文本关键词提取的准确率P、召回率R及F1。结果表明,当TopN取2~5时,F1平均值比最优方法提升4.8%。该方法抽取效果整体上均优于实验选取的对比方法,证明将特征工程与L