BERT模型的主要优化改进方法研究综述

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:lsd
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]对谷歌发布的BERT语言表示模型的主要优化改进方法进行梳理,为后续基于BERT的相关研究开发提供借鉴.[文献范围]自BERT发布以来,到目前与BERT模型优化改进相关的41篇主要文献及相关模型.[方法]根据模型优化改进的技术路线,从改进预训练目标、融合外部知识库、改进Transformer结构和预训练模型压缩4个方面,分别阐述优化改进的方式及产生的效果.[结果]预训练目标优化和Transformer结构改进最早受到研究者关注,并且成为BERT模型优化改进的主要方式,随后预训练模型压缩及外部知识库的融合也成为新的发展方向.[局限]BERT模型相关研究发展迅速,可能未覆盖一些相关研究工作.[结论]研究者可重点关注预训练目标优化和Transformer结构改进方面的研究,同时考虑根据不同应用场景选择模型优化方向.
其他文献
请下载后查看,本文暂不支持在线获取查看简介。 Please download to view, this article does not support online access to view profile.
会议
[目的]解决学术文献图表定位中低召回率问题.[方法]提取学术文献PDF文件中的几何对象,从编码分析和图片理解两种视角获取图表范围的先验信息,使用K-means聚类算法对几何对象
2017宁夏·中国特产中心开业暨贺兰首届文化旅游嘉年华启动仪式在贺兰县宁浙电商园举行。宁夏中国特产中心是宁浙两省在东西合作大框架下具体落实的省级合作项目,也是宁夏借