预训练语言模型的扩展模型研究综述

来源 :计算机科学 | 被引量 : 0次 | 上传用户:liug1001
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近些年,Transformer神经网络的提出,大大推动了预训练技术的发展。目前,基于深度学习的预训练模型已成为了自然语言处理领域的研究热点。自2018年底BERT在多个自然语言处理任务中达到了最优效果以来,一系列基于BERT改进的预训练模型相继被提出,也出现了针对各种场景而设计的预训练模型扩展模型。预训练模型从单语言扩展到跨语言、多模态、轻量化等任务,使得自然语言处理进入了一个全新的预训练时代。主要对轻量化预训练模型、融入知识的预训练模型、跨模态预训练语言模型、跨语言预训练语言模型的研究方法和研究结论进行梳理,并对预训练模型扩展模型面临的主要挑战进行总结,提出了4种扩展模型可能发展的研究趋势,为学习和理解预训练模型的初学者提供理论支持。
其他文献
潜流带作为地表水与地下水交互的区域,其中的水热交换对于河流廊道的水文和生物地球化学过程具有重要意义。本研究选取典型草原河流,采用水动力学法、温度示踪法结合数值模拟法,基于高分辨率的水位和水温监测结果,定量探究了2020年和2021年夏汛期锡林河顺直和曲流河段的潜流交换作用;基于FEFLOW构建了潜流带的三维水热耦合模型,分析了潜流带水热交换对不同水文事件和河道形态的响应及其生物地球化学意义。研究结
自然语言处理(NLP)研究从早期基于规则的方法转向基于特征分析的机器学习,再转向无需事先进行特征抽取的深度学习,发展很快,但因其需要的文本数据量越来越大,模型训练所需的标注工作量巨大,对算力的要求也越来越高,而难以被广泛应用。基于Transformer的预训练语言模型(T-PTLM)提供了一个新的研究和应用路径:通过大规模无标注文本数据广泛学习语言现象,使模型具有很强的通用性,然后将模型进行迁移和
在乡村振兴战略背景下,乡村教师成为新时代乡贤的重要代表。由于新时代乡贤是乡村振兴的重要力量,因而乡村教师乡贤身份表达能够且必须助力乡村振兴。乡村产业振兴、乡村文化振兴、乡村生态振兴、乡村人才振兴和乡村组织振兴,为乡村教师乡贤身份表达提供了路径选择。在“五大振兴”视角下,乡村教师能以“增产”“领路”“作宪”“筑才”“优治”的表达路径,践行乡贤身份,参与乡村建设,推动乡村振兴,充分彰显乡村教师的社会职
<正>审美化教学是将所有的教学因素(教学目标、教学内容、教学方法、教学环境、教学评价等)转化为审美对象,让教学活动成为审美欣赏、审美表现、审美创造的活动。绘本中精美而富有内涵的画面,带给幼儿丰富的感受力、想象力和创造力。将绘本阅读与审美化教学相结合,正是集“静”与“动”为一体的阅读模式。绘本阅读与审美化教学的融合,能给幼儿带来别样的视觉享受和体验,唤起幼儿对阅读的兴趣,同时更能让幼儿深刻理解绘本的
期刊
极简主义最早出现在西方现代主义运动中,是绘画领域广泛应用的一种创作风格,在新的时代环境下也与平面设计相融合,并发挥了重要的作用。极简主义的思想流传到现今社会,反映了人们的生活态度和审美方式的变化,并在平面设计领域得到了广泛的应用。和传统的繁杂精致风格有所不同,极简主义风格通过简洁精练且没有过度装饰的设计风格,达到一种纯粹的静美的艺术境界,无论是在广告设计、企业形象设计,还是室内设计中都得到了广泛的
<正> 负重 从政的人,有时必须忍辱负重,即便一时受人误解,也在所不辞。《四友斋丛说》卷8有如下一段记述: 刘谨擅国日,人皆责李文正不去。盖孝宗大渐时,召刘晦庵、李西涯、谢木斋三人至御榻前同受顾命,亲以少主付之。后瑾事起,晦庵去,木斋继去,使西涯又去,则
期刊
<正>一、技术背景2012年人工神经网络Alex Net在全球顶级计算机视觉比赛Image Net赢得世界冠军,且碾压了第二名基于支持向量机(SVM)的分类性能,人工智能自此又掀起了一次浪潮。当前,随着硬件能力的提高深度学习算法模型模型结构愈加复杂,计算量对比Alex Net也提升了数十个量级,随之而来的是性能的大幅提升。不可否认的是在算力允许的前提下,提高模型的复杂度、计算量是提升模型表现最有效
期刊
行政协议作为行政主体为实现公共管理目的而存在的柔性化的协议。区别于普通民事合同,行政协议中的行政主体占据行政协议的主导地位。为了防止行政主体滥用行政优益权,法院有必要对行政主体的单方解除权进行司法审查。我国对于单方解除行政协议的司法审查不够完善,存在行使条件、行使程序、补偿标准不明等问题。为克服上述障碍,可从“公共利益”界定、明确行使程序以及完善补偿标准等环节入手,不断完善司法审查制度。
寻找正规矩阵,是矩阵理论研究的重要课题之一.受Hermite矩阵和参考文献[1]的启发,发现适合条件A*=-A~2的矩阵是一类正规矩阵.利用正规矩阵,共轭转置矩阵,矩阵的奇异值等概念和理论,证明了这种矩阵可以对角化以及等式(A?B)*=(A?B)~2,给出了它的可能特征值的分布及其谱分解,以及等式(A⊕B)*=-(A⊕B)~2成立的充要条件,还给出了这种矩阵的奇异值分解式等.这些结论的获得都用到了