基于word embedding和CNN的情感分类模型

来源 :计算机应用研究 | 被引量 : 0次 | 上传用户:leneyao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
尝试将word embedding和卷积神经网络(CNN)相结合来解决情感分类问题。首先,利用skip-gram模型训练出数据集中每个词的word embedding,然后将每条样本中出现的word embedding组合为二维特征矩阵作为卷积神经网络的输入,此外每次迭代训练过程中,输入特征也作为参数进行更新;其次,设计了一种具有三种不同大小卷积核的神经网络结构,从而完成多种局部抽象特征的自动提取过程。与传统机器学习方法相比,所提出的基于word embedding和CNN的情感分类模型成功地将分类正确率提升了5.04%。
其他文献
鉴于传统分水岭算法存在过分割的缺点,并且考虑到反射亮光对图像的干扰,提出一种基于新颜色空间的改进分水岭彩色图像分割算法。该方法通过计算得到彩色图像在新颜色空间下不受反射亮光干扰的分量梯度,接着叠加融合在不同尺寸结构元下开闭重建的梯度图像,得到最终梯度图。同时,对最终梯度图采用最大类间方差算法自动获取阈值,用获得的二值标记图像对原始梯度图进行强制标定,对修正后的梯度图像用分水岭分割。实验结果表明,该
为了发现在微博网络中对话题传播有巨大影响力的用户,从网络的拓扑结构出发,对微博平台上话题信息的传播进行了研究,测量了话题传播的网络拓扑结构,并利用紧密中心度和介数中心度对传播过程中参与的用户进行了影响力测量。根据测量分析结果,利用随机游走思想,将两种方法进行优化,计算出一个新的参数称做扩张比,用来评价用户在整个话题传播过程中的影响力,实验结果表明优化后的方法能够有效地发现整个网络中影响力最大的重要
为快速高效地进行图像分割,针对人工蜂群算法存在的收敛速度慢、易陷入局部最优解等问题,提出了一种基于改进人工蜂群算法分割二维Otsu图像的新方法。通过对蜜源更新过程中向当前最优蜜源方向进行引导,可以加快算法的收敛速度;为避免算法陷入局部最优并加快收敛速度,在局部搜索过程中逐步缩减了搜索范围并加入了放弃机制;针对较大梯度值无意义的问题,限定了蜜源范围,以提高算法的效率。最后结合具有不同直方图分布的图像
云计算的核心是在虚拟化技术的基础上,通过互联网技术为用户提供动态易扩展的计算资源。利用中心服务器的计算模式来管控网络上大量云资源,使得中心服务器成为整个系统的瓶颈,不利于云计算的大规模应用,因此提出使用对等网络技术构建分布式的云资源索引存储和查询系统,但是结构化拓扑系统维护比较复杂,一般不支持复杂搜索条件查询。提出了一种多关键字云资源搜索算法,在基于分层超级节点的云资源搜索算法基础上进行路由算法改
为了提高应急车辆的通行效率,针对应急车辆需要绝对优先路权的特点进行了信号控制的研究,提出了一种基于相位差渐进循环协调的信号控制策略,并将其与应急车辆优先信号配时转
为降低模型预测控制优化问题的计算复杂度,以时滞系统的模型预测控制问题作为研究对象,利用神经网络动态平衡点与优化问题解相对应的特点,提出一种基于广义投影神经网络的模
对名词短语的事件指代消解进行研究,使用平面特征、结构化句法特征和语义特征等,根据SVM机器学习的方法进行英文事件的指代消解,通过在计算事件语义相似度的元组(语义角色)中加入
强化学习领域的一个研究难点是在大规模或连续空间中平衡探索和利用的问题。针对该问题,应用函数近似与高斯过程方法,提出新的行动者评论家(actor-critic,AC)算法。该算法在act
为了更好地研究坡道交通流的特征,基于Gipps安全驾驶的思想,考虑了坡道长度和纵坡度等因素,建立了一个新的更为精细的坡道交通流元胞自动机模型,并通过计算机数值模拟,对坡道交通
针对大尺度形变医学图像配准速度慢和精度低的特点,提出一种结合薄板样条(TPS)和B样条的弹性配准方法。该方法采用尺度不变特征变换算法(SIFT)进行图像特征提取与匹配,利用TPS算法将特征点对作为输入进行预处理,以降低浮动图像的形变尺度,从而提高下一步B样条配准的速度与精度。然后使用局部区域细化层次B样条方法将TPS生成的较稀疏的形变网格作为初始网格,结合有限记忆优化算法(L-BFGS)对控制网格