基于卷积神经网络的跨领域情感分析

来源 :云南大学 | 被引量 : 0次 | 上传用户:sdvfg4gf3fg3
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
基于传统学习方法的情感分类是以大量标签数据为基础的,因此利用标签样本充足的相关源领域去帮助标签数据不足的目标领域进行的跨领域情感分析、成为克服标签样本不足的一个可行方法。然而,情感分类往往与所涉及的主题和领域密切相关,因此一个领域的标签数据并不能简单地复制到另一个领域中。深度学习因其可以尽量避免特征工程的影响,尤其卷积神经网络(Convolutional Neural Networks,CNN)还具有良好的自适应性、容错性和自学习能力等优势,已经成功地应用到自然语言处理等很多领域中。本文面向跨领域情感分析,基于CNN研究领域间语义距离的缩小方法和领域间情感知识的迁移方法,具体工作主要包括以下两个方面的内容。(1)提出基于领域共享特征的跨领域情感分析方法。首先量化词项的情感极性、基于词向量度量词项的领域语义一致性,并在此基础上选择情感强烈且语义一致的词项作为领域间的共享特征,改进共享特征的选择方法;其次,基于共享特征扩展文本特征增强文本的情感语义,并完成跨领域情感分析。在Amazon产品评论数据集上的实验结果表明基于共享词的跨领域情感分析方法是有效的。(2)提出基于领域专有特征的跨领域情感分析方法。首先,基于词向量和修改后的互信息选取高质量的领域专有特征;基于所选领域专有特征的词向量和CNN模型完成跨领域情感分析任务。最后,基于Amazon产品评论数据集设计并进行一系列实验,同时对实验结果进行了分析。实验结果表明领域专有特征和CNN相结合的方法可以提高跨领域情感倾向的预测性能。
其他文献
为了增加通信系统的可靠性,信道编码技术获得了广泛的应用。其中,低密度奇偶校验码作为一种具有接近信道容量性能的信道编码方案,被广泛应用于现代通信系统如DVB-S2,10-Gbit
社会网秘密共享方案是针对社会网中秘密共享中存在的“理性”参与者、方案动态调整以及声望系统合作进行研究的。动态调整是由于参与者之间交互行为,导致参与者数量、秘密值以及声望权重的变动,具有很大的实用性,是目前研究热点。由于秘密共享方案在社会网中动态调整的复杂性,因此研究社会网秘密共享方案中的动态调整和欺骗检测具有理论和实际意义。很多现有的动态调整方案中,在动态调整参与者后,存在被删除参与者仍能利用旧分
随着新时代的到来,人类生产力的极大改善和科学技术的快速发展,我们日常使用的计算机性能也得到了很大的提升,这极大的改善了我们生活的质量和方式,其中最具有代表性的就是云计算的普及和计算性能的不断优化改进,所以互联化和数字化的生活已经渗透到我们生活的每一角落,从当今最流行的数字货币(比特币、莱特币)、电子支付手段(支付宝、微信钱包)和使用最普遍的数字图书馆就是最好的体现。但是,当数字时代带给我们很大便利
混沌序列具有初值敏感性、非周期、均值遍历性等优良的特性,因此混沌序列在保密通信、数字图像加密领域中得到了广泛的应用。传统的数字混沌序列受限于计算机的存储字长,不可避免地存在周期退化问题。另一方面,在硬件实现时,过大的计算位宽会增加硬件迭代边界,使得序列的输出速率降低,从而降低了加密效率。本文采用了基于余数系统和置换多项式的混沌序列生成方法,该方法利用余数系统将大位宽的乘加运算用多个小位宽的并行运算
立体匹配是在两个或多个相同场景的二维图像中找到对应的匹配点,根据匹配点的对应关系,求出该场景的视差图。由于受到噪声、遮挡、深度不连续区域和低纹理区域等这些因素的影
软件的安全性问题越来越突出,当下,除了应用同行评审和软件测试等进行验证外,还可应用形式化验证在项目早期尽快发现软件缺陷。形式化验证指采取数学方式对软件系统建模并分
近年来,液晶面板以其轻巧,便于携带,高清,大屏,色彩绚丽显示,微功耗等优点在人们的生活中应用越来越广,已占据显示市场的主流。随着人们对液晶面板显示要求的不断提高,市场对
机器对机器(Machine to Machine,M2M)通信有望在5G网络中扮演十分重要的角色。M2M通信网络中,机器类通信设备(Machine Type Communication Device,MTCD)在没有人为干预的情况
背景:动脉粥样硬化(Atherosclerosis,AS)是心脑血管疾病共同的病理生理基础。新发现的生物活性肽Salusin-α具有抗动脉粥样硬化作用,主要通过抑制酰基辅酶A:胆固醇酰基转移酶
流程挖掘作为企业信息系统日志分析的重要手段,被广泛用于理解系统运行时产生的流程执行日志、多视角地发现流程模型以及结合挖掘结果进行服务管理。在以移动应用为代表的新