基于深度学习的中文文本情感分类研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户：baochangjingmao

【摘要】

：

文本情感分类已经在情感分析的研究中占据相当重要的地位,它主要通过自然语言处理,文本挖掘以及计算机语言学等方法来识别和提取文本中的主观信息。伴随着信息的爆发式增长,

【作者】

：

肖登明

【出处】

：

华中科技大学

【发表日期】

：

2017年期

【关键词】

：

文本情感分类深度学习卷积神经网络迭代神经网络 C-LSTM

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

文本情感分类已经在情感分析的研究中占据相当重要的地位,它主要通过自然语言处理,文本挖掘以及计算机语言学等方法来识别和提取文本中的主观信息。伴随着信息的爆发式增长,很多研究者将深度学习的理论运用于文本情感分类,并且在句子及文档的情感分类中取得了不错的效果。卷积神经网络能够捕获空间结构上的局部关系,可以出色的提取到句子中各部分的局部特征,但缺乏学习连续句子间相关性的能力。迭代神经网络能够处理连续性的信息,使其在句子或文档的建模中取得了很好的效果,但在并行的提取文本特征方面则效果不佳。针对这些问题,该研究构建了一种新的结合卷积神经网络和迭代神经网络各自优势的深度学习模型——C-LSTM(Convolutional-Long Short-Term Memory),用于句子的表示和文本情感的分类。具体的工作如下:1、对当前主流的用于文本情感分类的深度学习模型进行了研究,构建了基于卷积神经网络(Convolutional Neural Network,CNN)和基于LSTM(Long Short-Term Memory)的中文文本情感分类模型用于研究。2、在此基础上,构建了基于C-LSTM的中文文本情感分类模型,用于文本情感分类的研究,该模型利用卷积神经网络提取句子中高级别的词语表示,将获得的结果输入LSTM得到句子的表示,既获得了词语间的局部特征,又获得了全局的语义特征。3、针对带情感标注的中文文本数据集少的问题,通过网络爬虫的方式收集了六大领域的带情感标注的中文文本数据25000条,用于中文文本情感分类的研究。4、通过网格搜索的方式对超参数进行调节,使模型的训练达到最好的效果。并将三种模型的实验结果进行对比分析,C-LSTM模型确实在分类准确率上有所提高。

其他文献

内置高强钢管的圆钢管混凝土柱轴压性能试验研究

开展了12根内置高强钢管的圆钢管混凝土柱的轴压试验,考察了内钢管屈服强度、内外钢管净距、内钢管取钢率、废旧混凝土块体取代率等因素对柱轴压性能的影响。研究表明:在总用

期刊

内置高强钢管钢管混凝土柱废旧混凝土块体轴压性能试验研究built-in high-strength steel tubeconcrete-filled

确认违禁物质阈值的阳性决定限WADA技术文件—TD2013DL

本文是国际反兴奋剂实验室委员会最新发布的技术文件,明确规定了在此类检测实验室中对于检测阳性结果定量检测与判定方法,在其附录中推荐3种测量不确定度的评估,以及实验方法

期刊

兴奋剂检测测量不确定度方法确认检测实验室测量不确定度验证

抗裂水泥稳定碎石基层施工工艺与质量控制

结合铜汤高速公路路面04标抗裂水泥稳定碎石基层的施工实践．介绍抗裂水泥稳定碎石配合比设计、施工准备、试验段铺筑、拌和、摊铺、碾压、养生等施工工艺，总结质量控制要点及经

期刊

抗裂水泥稳定碎石施工工艺质量控制anti-crack cement stabilization macadam construction techniqu

水泥砂土浆的力学性能试验研究

针对华南地区量大面广的两类渣土(花岗岩风化残积土、冲洪积土),建议用相应的处理工艺;采用处理后的可用渣土部分或全部取代天然河砂以制备水泥砂土浆,考察了基于工作性能的

期刊

花岗岩风化残积土冲洪积土水泥砂土浆力学性能压汞测试weathered residual soil of granitealluvial-diluvia

数字调幅广播系统(DAM)中应用Turbo码的分析

描述了一个利用MATLAB设计的仿真平台,用于分析Turbo码应用于AM频段数字音频广播系统的性能,简要说明了平台中使用的Turbo码的编、解码算法。利用此平台以DRM(全球数字广播)

期刊

Turbo码加性高斯白噪声MAP算法Viterbi算法全球数字广播

美国结构设计最好的大钩

美国Byron Jackson公司生产的大钩,由于具有结构设计新颍、使用可靠、性能良好等优点,因此,被认为是美国大钩结构中最好的一个。这种大钩的特点如下: 1.液力缓冲器:BJ大钩液

期刊

锁紧装置结构设计

我国民航首台全动模拟机投入运营

3月24目，我国民用航空局购买的首台空中客车A320全动模拟机在空中客车中国公司的华欧航空培训中心正式投入运营，这将大大加强我国民航局与空中客车公司的培训合作能力。

期刊

模拟机运营民航空中客车中国公司空中客车公司培训中心民用航空A320

浅谈糠醛的生产、用途、供求和价格

【正】市场上俗称“糠醛”的有机化工产品,它的化学名称叫“呋喃甲醛”,是一种呈微黄色的油状液体,以农、林付产品如棉籽壳、谷壳、玉米蕊、油茶籽壳、向日葵壳、花生果壳等

期刊

糠醛棉籽壳茶籽壳向日葵壳化工产品合成纤维农药工业合成树脂用途价格上升

SAC沥青混合料设计方法

通过对河北省沿海高速公路秦皇岛段进行重载交通长寿命半刚性基层沥青路面关键技术的研究,提出优化的SAC沥青混合料设计方法,尝试在解决沥青面层的早期破坏问题的同时满足面

期刊

粗集料设计SAC断级配coarse aggregate design SAC gap gradation

Petir网分析工具对一个通讯规程的验证

本文对ISO协议的传输层通讯规程在文献[1]验证的基础上,使用Petri网工具予以佐证。

期刊

PETRI网分析工具通讯规程

基于深度学习的中文文本情感分类研究

与本文相关的学术论文