基于卷积神经网络的短文本分类关键技术研究

来源 :战略支援部队信息工程大学 | 被引量 : 0次 | 上传用户：vampirewoo

【摘要】

：

文本分类是自然语言处理领域的一个重要研究课题,其主要任务是将输入文本自动归类。随着互联网技术的快速发展,如今全世界每时每刻都有数以亿计的文本信息在互联网中产生,其

【作者】

：

柳杨

【出处】

：

战略支援部队信息工程大学

【发表日期】

：

2019年01期

【关键词】

：

卷积神经网络短文本分类激活函数注意力机制门控机制

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本分类是自然语言处理领域的一个重要研究课题,其主要任务是将输入文本自动归类。随着互联网技术的快速发展,如今全世界每时每刻都有数以亿计的文本信息在互联网中产生,其中主要以一般不超过160个字符的社交媒体博文、论坛回帖、网络问答和商品评论等短文本为主。如何高效准确的对海量短文本信息自动化分类已成为当前一个非常具有挑战性的任务,受到了研究人员的广泛关注。近些年来,基于深度学习(尤其是卷积神经网络)的短文本分类关键技术研究取得了长足的进展和爆发式的突破,但以下问题仍然存在:(1)传统文本特征表示方法受数据集大小及文本长度影响较大,容易造成维度爆炸、特征冗余或特征稀疏等问题,现有的单语义词向量方法没有考虑词的多义性,多语义词向量方法在计算时没能有效利用语境中词序、句法结构、词间距等信息对词的语义表达的影响;(2)短文本的长度普遍较短、提供的语义信息有限,因而现有的卷积神经网络模型对短文本抽象特征的抽取不充分,如何对卷积神经网络的结构进行改进,使其更适合处理短文本数据仍是一个亟待解决的问题;(3)整流线性单元(Rectified Linear Unit,ReLU)具有容易发生偏移(bias shift)问题和神经元容易死亡问题。当前针对激活函数的优化和改进大多放弃了稀疏激活的特性,但在不同深度和结构的卷积神经网络上的表现不稳定;其他针对网络结构和正则化方法的优化和改进往往会增加网络的参数量和计算复杂度,使模型难以训练。因此本文针对以上存在的问题,对基于卷积神经网络的短文本分类的多项关键技术展开深入研究与探索,主要工作成果如下:1.提出一种基于门控卷积与层次注意力机制的多语义词向量计算方法。首先提出了一种由单语义词向量与子语义偏移向量构成多语义词向量的方法,然后提出一种层次注意力门控卷积神经网络模型,基于该模型可进行多语义词向量的计算和学习。该模型综合考虑了词的多义性、词序、句法结构、词间距等语境信息对词义表达的影响,基于多个非残差块封装的门控卷积层构建了由子语义注意力层和合成语义注意力层构成的层次化注意力机制。实验结果表明,基于该方法计算得到的多语义词向量相较于基线方法表现有所改善,并且层次注意力门控卷积神经网络模型在语言建模任务上也优于其他预测目标单词的方法。2.提出一种基于注意力门控卷积神经网络的短文本分类方法。针对由于短文本长度有限导致当前卷积神经网络中的池化层难以下采样到真正重要的特征的问题,该方法基于分布式假说和通过引入一种注意力门控层模拟人类的注意力机制来控制目标单词或片段对应的抽象特征的重要程度,帮助模型找到真正重要的抽象特征。实验结果表明,注意力门控卷积神经网络的注意力机制是有效的,该方法相比于基于标准卷积神经网络的短文本分类准确度有所提升,并且在多个任务中产生与其他强基线模型相比富有竞争力的结果。3.提出一种基于参数自然对数转换的整流激活函数。该方法在保留激活函数稀疏激活特性的同时,引入参数自然对数转换对ReLU激活函数输入大于0的部分进行改进。该激活函数可以在不同的网络上微调、将每个隐藏层的激活均值推至接近零均值并减少方差、缩小大多数梯度并使梯度难以进入饱和状态,因而具有降低层间数据分布的偏移效应和异方差异性、一定程度上缓解神经元容易死亡问题和梯度消失问题等优点。实验结果表明,该方法可以提高卷积神经网络的收敛性能、加速学习进程并改善基于标准卷积神经网络和注意力门控卷积神经网络在短文本分类任务上的分类准确率。4.提出一种名为N折叠加的改善卷积神经网络的优化方法。该方法通过特征图共享和全连接层权重共享,在没有显著增加网络参数的情况下,可以降低特征图噪声和改善卷积神经网络收敛性能。本文通过费马引理及多元函数的极值判定等定理证明了N折叠加方法通过构建更多损失函数的全局极小值点,使模型更容易收敛并提高网络性能。实验结果表明,该方法可以降低特征图噪声、加快神经网络收敛速度、改善基于标准卷积神经网络在短文本分类任务上的分类准确率。

其他文献

MCSN中基于信誉的任务分配机制研究

在无线通信技术和传感器技术快速发展、移动智能终端广泛普及的背景下,出现了移动群智感知网络(Mobile Crowd Sensing Network,MCSN)这一全新的物联网感知模式。MCSN中,用户(

学位

移动群智感知任务分配数据有效率信誉评价采集者参与度

美国IBDP标准学习水平化学课程教材“科学本质”栏目分析研究

IB课程是一种大学预科课程,是全球官方教育组织机构认可的具有较高专业水准的教育项目,旨在培养专业素养较高的高端文化人才。IBDP课程的教学标准尊重各国的教育政策,并且基

学位

IBDP国际课程IB化学课程教材栏目科学本质

改进烟花算法的风机智能诊断系统研究与实现

现代工业的进步与信息技术发展密不可分,愈来愈趋于智能化。大型化工业设备往往会经历长时间不停机连续运转,在运转期间设备可能会产生相互撞击的情况,或是设备零部件之间产

学位

故障诊断相关峭度解卷积烟花算法BP神经网络

层状Ⅵ（Ⅶ）族铋化物纳米材料的制备及其酒敏性能研究

层状材料因自身的各向异性而具有独特的物理化学性质,从而为人们提供了广阔的应用前景。作为层状材料中的一员,铋基化合物因其低毒性、稳定性等特性已逐渐成为材料、物理、化

学位

层状材料铋基纳米材料p-n/n-n异质结乙醇气敏性能

改进HGWO-SVR模型的带钢厚度预测系统研究与实现

随着我国工业的发展,科技的进步,越来越多传统工业与现代科技相结合,向精细化和自动化管理发展,同时工业为人们提供的产品,不论是其性能还是功能都有所提高。因此对工业产品

学位

支持向量回归灰狼算法差分进化带钢厚度互信息

基于主题—情感联合模型的网络舆情情感演化分析研究

随着自媒体时代的到来,媒体逐渐朝着个人化的方向发展,无论是微信、贴吧还是微博,每个网民都能够通过网上新闻跟帖的方式来表达自己对于热点事件的情感和观点,网络成为了舆情

学位

网络舆情语义角色标注TF-IDF+K-Means聚类主题—情感联合模型情感演化分析

基于系统理论的大中专数学教育的接轨问题研究

国家教育体系的发展,现代教育对不同层次的人才进行分流,中专学生在学习的竞争中,偏向学习技能的发展,但数学作为基础学科,由于学生们的基础较差,数学的学习能力不强,相对大

学位

中专数学系统理论整体性层次性开放性

二次静电放电特性仿真与实验研究

二次静电放电(Secondary Electrostatic Discharge,SESD)是一种特殊的静电放电现象,相比一般意义上的静电放电事件,二次放电发生在电子仪器、设备内部的微小间隙之间,威胁过

学位

静电放电二次放电统计实验粒子碰撞模型微观特性

基于GPU的无透镜数字全息卷积重建算法的实现与优化

无透镜数字全息成像技术通过光电传感器记录下物光与参考光的干涉图样,利用计算机数值模拟再现光的衍射过程,从而得到含有被测物振幅信息和相位信息的重建图。该技术结构简单

学位

无透镜数字全息重建算法通用GPU技术并行计算

选矿过程自动化软件监控画面测试平台的设计与开发

选矿工业在国民经济中占有重要地位,选矿生产过程实现自动控制是提高产品质量、节能降耗、减员增效的关键所在。自动控制系统特别是PLC控制软件在现场投运之前,需要经过一系

学位

选矿过程监控画面测试平台

基于卷积神经网络的短文本分类关键技术研究

与本文相关的学术论文