一种基于混合词向量的胶囊网络文本分类方法

来源 :小型微型计算机系统 | 被引量 : 0次 | 上传用户:tanya1005
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本分类是目前深度学习方法被广泛应用的重要领域之一.本文设计了一种基于循环神经网络和胶囊网络的混合模型,使用胶囊网络来克服卷积神经网络对空间不敏感的缺点,学习文本局部与整体之间的关系特征,并使用循环神经网络中的GRU神经网络经过最大池化层来学习上下文显著信息特征,结合两者来优化特征提取过程从而提高文本分类效果.与此同时,在嵌入层中提出了一种基于缺失词补全的混合词向量方法,采用两种策略来减少缺失词过度匹配的现象以及降低词向量中的噪声数据出现的概率,从而获得语义丰富且少噪声的高质量词向量.在经典文本分类数据集中进行实验,通过与对比模型的最优方法进行比较,证明了该模型和方法能有效地提升文本分类准确度.
其他文献
在Simulink仿真环境下,采用层次化方法建立了中脉冲重复频率(MPRF)机载PD雷达数字仿真系统,给出了仿真的系统框图和仿真结果。对该机栽PD雷达在不同情况下的检测性能和抗干扰能力
在殖民地经验和英国传统的基础上,美国通过在宪法中规定司法授予条款的方式在联邦层面上重塑了其海事管辖权。在对历史先例的扬弃之下,海事管辖权的范围存在着几种不同的阐释
水培法研究烟草打顶和喷施外源生长调节物质的结果表明:打顶的比不打顶的烟草根中鸟氨酸脱羧酶(ODC)、腐胺N-甲基转移酶(PMT)和N-甲基腐胺氧化酶(MPO)活性升高,烟叶中烟碱含
7月1日是中国共产党成立纪念日。每年7月1日,我党都要举行纪念活动。特别是每逢十年大庆,纪念活动更是隆重而丰富多彩。纪念建党其实质就是深入挖掘和宣传党的历史,从党的历
<正> 老鼠是人们比较讨厌的一种动物,它往往给人们造成破坏性的灾害。老鼠又是一种适应性很强的动物,从高山到平原,从炎热的热带地区到冰天雪地零下20度的地方,几乎都有它的
基于树木年轮学理论与方法,探讨了腾格里沙漠南缘昌岭山青海云杉(Picea crassifolia)和油松(Pinus tabu-laeformis)径向生长的气候响应特征及其记录的1850s以来气候干湿变化。
本文针对履带车辆工作环境和条件以及履带板销耳孔和履带销磨损失效情况,借助定型试验数据,对履带板销耳孔(以下简称销耳孔)和履带销磨损寿命及规律进行了分析,得出了它们的磨损寿
对食用鼠曲草总黄酮的提取工艺和抗氧化活性进行了研究。采用微波辅助提取法,提取了鼠曲草中的黄酮类化合物.测定了鼠曲草黄酮的体外抗氧化活性,并与常见的抗氧化剂VC进行了比较
进入信息化时代,图书数量、更新换代速度飞速提高,加大了图书馆管理人员的工作难度,并给数字化建设带来不便。为此,文中设计并实现了一种图书分类系统,将双向LSTM模型引入到