transformer架构相关论文
神经文本生成模型的一般模型是序列到序列(seq2seq)的模型,其核心思想是按序列顺序采样单词来生成文本,其中每个单词都以前一个单......
介绍了文本词向量及预训练语言模型的发展体系,系统整理并分析了其中重点方法的思想特点。首先,阐述了传统的文本词向量表征方法及......