基于RoBERTa-CRF的古文历史事件抽取方法研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户：vingf

【摘要】

：

【目的】为有效抽取典籍中蕴含的事件信息,构建面向典籍的事件抽取框架,并采用RoBERTa-CRF模型实现事件类型、论元角色和论元的抽取。【方法】选择《左传》的战争句作为实验数据,建立事件类型和论元角色的分类模板。基于RoBERTa-CRF模型,先用多层Transformer提取语料特征,再结合前后文序列标签学习相关性约束,由输出的标记序列识别论元并对其进行抽取。【结果】对比GuwenBERT-LSTM、BERT-LSTM、RoBERTa-LSTM、BERT-CRF、RoBERTa-CRF等5种模型在数据集

【作者】

：

喻雪寒何琳徐健

【机构】

：

南京农业大学信息管理学院

【出处】

：

数据分析与知识发现

【发表日期】

：

2021年7期

【关键词】

：

RoBERTa CRF 事件抽取古文

【基金项目】

：

南京农业大学中央高校基本科研业务费(项目编号:SKCX2020006),中国博士后面上基金(项目编号:2020M681652)的研究成果之一。

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

其他文献

我国智慧教育示范区创建路径的案例研究

智慧教育示范区是教育信息化2.0行动计划的重点任务和高阶目标,是推行智慧教育的试点工程。基于此,文章通过案例分析方法,以首批入选的8个示范区在项目启动会上、第二次工作会议上的汇报报告和各示范区发布的相关政策文件作为文本来源,主要从创建的基础、创建的重点和建设的成果三个维度对各示范区的创建方案、建设情况进行分析,并结合示范区的具体情况,梳理总结出各区域在学习环境的联通、公共服务的优化、信息素养的培养、数据驱动的评价和教育治理的提升五个方面取得的系列成果。此外,文章基于对智慧教育示范区创建中存在的问题进行反思

期刊

智慧教育示范区智慧教育创建路径教育信息化案例研究

基于两阶段迁移学习的多标签分类模型研究

【目的】构建一个基于两阶段迁移学习的多标签分类模型,以解决现有模型中多标签数据采样困难与跨领域迁移学习共性特征较少的问题。【方法】提出“通用领域-目标领域单标签数据-多标签数据”的两阶段迁移学习模型,首先在通用领域上训练,之后迁移到使用上采样方法均衡后的目标领域单标签数据进行微调,最后迁移到多标签数据,实现多标签分类。【结果】以医学文献图像标注为例,实证结果表明:所提模型对于图像多标签分类和文本多标签分类任务均有较好效果,F1值在一阶段迁移学习模型的基础上提升超过50%。【局限】如何根据不同任务优选基

期刊

多标签分类迁移学习数据均衡化BERT模型ResNet模型

基于不确定性损失函数和任务层级注意力机制的多任务谣言检测研究

【目的】通过引入不确定性损失函数和层级注意力机制,解决多任务谣言检测研究中主观设定主任务和辅助任务问题。【方法】融合谣言勘探、立场检测和谣言检测任务的领域信息,构建改进的任务层级注意力机制模型。同时,首次在多任务谣言检测研究中,引入同方差不确定性损失函数,替代传统损失函数。最后使用PHEME数据集,将改进模型与传统多分类模型进行对比。【结果】所提模型相比于目前最优模型,在Pheme4数据集中,Macro-F值提升4.2个百分点;在Pheme5数据集中,Macro-F值提升7.6个百分点。【局限】只在Phe

期刊

不确定性损失函数多任务学习谣言检测注意力机制

学习共同体如何迈向共生:他者性视域

面对实践中遭遇的“合而不作”“共而不享”“共而不生”等困境,学习共同体如何在“共在”中迈向“共享、共生、共荣”成为亟需破解的难题。沿着“现实检视-意蕴重构-路径再造”的致思进路,检视学习共同体之“美景宏愿”遭遇“尴尬窘境”的现实,文章从内在机理上剖析其致因,明确平等、和谐、负责的主体间关系是撬动窘境、实现宏愿之关键,厘清主体间关系构建之理路。此外,文章以开展多年的“摄影基础”课程为实践基础,基于他者性理论提出从“精拟学习契约,重建主体性,生成主体自觉”“建立多重圈群,重塑伦理价值,激发主体责任”“组织多样

期刊

学习共同体主体间性他者性主体间关系

RLCPAR:一种基于强化学习的中文专利摘要改写模型

【目的】提出一种基于强化学习的中文专利摘要改写模型(RLCPAR),以解决现有的自动摘要方法在处理多句子摘要改写时存在的句子冗余和准确率低的问题。【方法】引入专利术语词典,运用基于强化学习的句子抽取方法,对专利说明书文本的关键句进行抽取,利用Transformer深度神经网络文本生成方法生成候选摘要,最终融合专利原始摘要信息,经过语义去重和排序得到改写的摘要。【结果】RLCPAR模型实现端到端的专利摘要改写,并且在ROUGE-1、ROUGE-2和ROUGE-L评价标准上分别达到56.95%、37.21%和

期刊

专利摘要自动改写强化学习神经网络文本生成

社会化媒体用户隐私计算量化模型构建及隐私悖论均衡解验证

【目的】基于传统隐私计算提出可量化模型,对社会化媒体平台用户的隐私悖论行为进行更客观的量化研究。【方法】采用IRT模型和灰色关联分析法对用户信息进行量化,并从效用最大化的角度——感知效益和感知风险的角度构建模型,计算和分析社交平台上的均衡解。利用部分用户信息代入模型进行验证。【结果】通过量化计算,得到平台风险量为0.479,小于0.508的效益量,从而求得均衡系数为1.063。结果验证了隐私悖论的存在,并且利用数据检验模型,符合现实情况。【局限】对感知效益量化框架缺乏检验,并且无法获得用户更全面的数据。两

期刊

隐私悖论隐私计算IRT模型灰色关联分析熵权法

基于公开履历数据的人物知识图谱构建

【目的】基于公开履历信息,结合自然语言处理技术与知识图谱构建技术,自动化建立履历知识图谱,为传统研究提供新的视角和工具。【应用背景】自动抽取履历数据中的人物背景、职衔信息并构建任职经历和机构同事等关系,通过可视化呈现的方式为企事业单位的人才选拔、人事任免任务提供决策支持。【方法】爬虫获取履历数据后,使用BERT-BiLSTM-CRF模型进行实体识别,通过定义规则与融合外部领域知识构建实体间关系,并使用Neo4j图数据库实现实体及关系的存储与图谱可视化。【结果】BERT-BiLSTM-CRF模型在实体识别任

期刊

履历分析知识图谱实体识别人物图谱

面向深度学习的论文阅读系统研究

在深入推进高校教育教学改革的背景下,如何利用技术手段促进学生的能力发展,是教育研究者关注的核心问题。文章依据深度学习理论,从深度学习准备、知识建构迁移、深度评价反思三个阶段出发,以培养学生的批判性思维、问题解决、系统思维、元认知、沟通合作等五项关键能力为目标,构建了面向深度学习的论文阅读系统,旨在通过技术手段促进学生深度阅读。系统的初步教学应用表明:系统可以促进学生深度阅读,小组学习和主题研究活动可以实现协同意义建构,同时能够辅助教师管理班级。期待通过对论文阅读系统的设计、开发与评估等方面研究,能推动深度

期刊

深度学习论文阅读系统系统设计开发

基于深度学习的科技文献摘要结构要素自动抽取方法研究

【目的】构建基于深度学习的科技文献非结构式摘要结构要素自动抽取方法。【方法】以结构式摘要为训练样本,采用LSTM、Attention机制等深度学习方法训练模型,自动抽取非结构式摘要中的“目的”“方法”“结果”三种结构要素,并对摘要进行结构化。【结果】该方法对非结构式摘要中的“目的”“方法”“结果”三种结构要素抽取的F值分别为0.951、0.916、0.960。【局限】深度学习可解释性相对较弱。【结论】该方法在非结构式摘要的结构要素自动抽取和摘要结构化方面具有良好的准确性。

期刊

深度学习Attention-LSTM结构要素抽取

基于认知深度模型的STEM课程设计路径研究

进行高质量的STEM课程设计,是确保STEM教学实践有效性的关键。文章基于认知深度模型,针对STEM课程案例进行分析,挖掘不同年级STEM课程在设计思路、目标定位、主题内容、活动设计、成果输出等要素设计中所处的认知深度层级。文章指出,低年级(1、2年级)STEM课程设计强调学生通过感官体验以习得基本知识和技能,处于认知深度模型中的“回忆/重现”“技能/概念”层级;中年级(3、4年级)STEM课程设计强调引导学生的发现、探究、问题解决、方案设计,处于认知深度模型中的“策略性思维”层级;高年级(5年级及以上)

期刊

STEM课程认知深度模型课程设计低年级中年级高年级

基于RoBERTa-CRF的古文历史事件抽取方法研究

与本文相关的学术论文