基于双向长效注意力特征表达的少样本文本分类模型研究

来源 :数据分析与知识发现 | 被引量 : 0次 | 上传用户:baihe0415
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
[目的]针对当前文本分类任务中存在的训练数据匮乏以及模型泛化性能低等问题,在少样本环境下研究文本分类问题,提出一种少样本文本分类模型.[方法]基于元学习中的分段训练机制将文本分类任务划分为多个子任务;为了捕捉每个子任务中文本的长效上下文信息,提出双向时间卷积网络;为了捕获辨别力更强的特征,联合双向时间卷积网络和注意力机制提出双向长效注意力网络;利用一种新的神经网络模型度量每个子任务中查询样本与支持集的相关性,从而实现少样本文本分类.[结果]在ARSC数据集上进行实验,实验结果表明,在少样本环境下,该模型的分类准确率高达86.80%,比现有先进的少样本文本分类模型ROBUSTTC-FSL和Induction-Network-Routing的准确率分别提高了3.68%和1.17%.[局限]仅针对短文本分类问题,对于篇幅较长的文本,其分类能力有限.[结论]双向长效注意力网络克服了训练数据匮乏问题且充分捕获文本的语义信息,有效提高了少样本文本分类性能.
其他文献
[摘 要] 将一个大系统电路以功能单元化进行分块焊接与调试的方法,使操作者边练习焊接边分析电路原理,可以将理论与实操有相结合起来。操作者首先分析大系统电路功能,将其以功能化分成若干块小电路来焊接与排障,一般按供电电路先行,其次按信号流程逆向进行,比如:后级输出电路(大信号电路)、中间放大电路、信号输入电路(小信号电路),最后整机联合调试。如果某块电路出现故障时,可以针对此块电路进行独立功能分析,
校园文化是指在一所学校内,经过长期积淀形成的,以师生为主体创造并达成共识的,由价值观念、办学思想、群体意识和行为规范等构成的价值体系,是一所学校独具的精神与氛围的集
[目的]为保护临床文本中的隐私信息,有效地从非结构化文本中识别受保护的健康信息(PHI),提出利用BiLSTM-CRF模型从临床记录中删除隐私信息的自动化方案.[方法]选择一家区域卫
[目的]在标注语料匮乏的情况下,利用主动学习策略,探索科技文献信息抽取的有效解决方案.[方法]设计一种融合主动学习的神经网络模型架构,将三种代表性的主动学习策略(MARGIN,
交际能力表现为听、说、读、写四个方面能力的培养,听、说、读、写既是教学目的,又是教学手段,四者是统一整体,相辅相成。教学中应综合听、说、读、写四方面技能,不能顾此失