基于BERT-BiLSTM-CRF的学者主页信息抽取

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:huangxl2000
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
学者的个人主页提供了准确的学者信息,这些信息在专家推荐等方面有着非常重要的应用。传统的学者主页信息抽取方法过度依赖人工定义特征。为了减少对人工的依赖,提出一种基于神经网络的序列标注模型,自动挖掘文本中隐藏的特征。该模型利用BERT(bidirectional encoder representation from transformers)获得词的向量化表示,然后输入到双向长短期记忆网络中进行上下文的编码,最后通过条件随机场标注标签。实验结果表明,在F1值上,该模型对学者主页信息的抽取效果远高于传统
其他文献
目的探讨重组人尿激酶原冠状动脉内注射对行经皮冠状动脉介入术(PCI)的急性心肌梗死患者的影响。方法选取2016—2017年在安徽省第二人民医院行PCI的急性心肌梗死患者58例,采
苏北是江苏省欠发达地区,要想振兴经济必须走新型工业化道路。本文首先分析了苏北当前的工业化进程,认为苏北处于工业化初期阶段;接着从欠发达地区、可持续发展、信息化和产业结
A metal-organic coordination polymer [Cd2(cbba)4(bix)2] n·nH2O (Hcbba=2-(4′-chlorine-benzoyl)-benzoic acid, bix=1,4-bis(imidazol-1-ylmethyl)-benzene) 1 ha
深度学习算法在时间序列预测领域具有较大优势。基于深度学习中的长短期记忆模型(LSTM)构建了LSTM与GARCH族混合模型,以期融合新型深度学习模型和传统统计计量模型的各自优势,进而提高人民币汇率波动率预测的精度。选取2009—2018年的数据,对比分析了LSTM与GARCH族混合模型、单一LSTM模型和单一GARCH模型的预测结果。实验结果表明,LSTM与GARCH族混合模型要优于单一模型,单一
随着网络技术的不断发展,计算机的使用率普遍增加。"互联网+"时代,企业和个人支付和转账大多通过网上银行进行操作,但在公司交易转账过程仍存在较大的安全隐患。智能财务风险
在列车控制与网络服务(train control and service network,TCSN)中,根据列车网络的特点,在分析加权公平队列调度算法(weighted fair queuing,WFQ)的基础上,提出了一种基于队列长度的动态加权公平队列调度算法(dynamic weighted fair queuing based on queue length,DQLWFQ)。该算法根据不同业
本义综述了新生儿肺出血的发病机制研究进展,主要为六个方面:(1)氧自由基学说;(2)肺表面活性物质异常;(3)高粘滞血症所致肺动脉高压;(4)内皮源性血管活性因子ET-1/NO分泌失凋;(5)肺泡毛细血管
本文以破产债权流程的顺利进行为前提,针对这一问题展开分析。首先对破产债权以及破产债权确认进行了介绍,随后阐述了破产债权确认环节存在的不足,最后从管理人和法院具有的
一、聚焦:高原石刻第一村$$和日村因“石刻”在雪域高原上享有盛名,有“石雕艺术之乡”和“高原石刻第一村”的美誉。$$和日村位于青海省黄南藏族自治州泽库县,是和日镇下辖的一
学位