基于深度学习的中文文本情感分类研究

来源 :华中科技大学 | 被引量 : 0次 | 上传用户:baochangjingmao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本情感分类已经在情感分析的研究中占据相当重要的地位,它主要通过自然语言处理,文本挖掘以及计算机语言学等方法来识别和提取文本中的主观信息。伴随着信息的爆发式增长,很多研究者将深度学习的理论运用于文本情感分类,并且在句子及文档的情感分类中取得了不错的效果。卷积神经网络能够捕获空间结构上的局部关系,可以出色的提取到句子中各部分的局部特征,但缺乏学习连续句子间相关性的能力。迭代神经网络能够处理连续性的信息,使其在句子或文档的建模中取得了很好的效果,但在并行的提取文本特征方面则效果不佳。针对这些问题,该研究构建了一种新的结合卷积神经网络和迭代神经网络各自优势的深度学习模型——C-LSTM(Convolutional-Long Short-Term Memory),用于句子的表示和文本情感的分类。具体的工作如下:1、对当前主流的用于文本情感分类的深度学习模型进行了研究,构建了基于卷积神经网络(Convolutional Neural Network,CNN)和基于LSTM(Long Short-Term Memory)的中文文本情感分类模型用于研究。2、在此基础上,构建了基于C-LSTM的中文文本情感分类模型,用于文本情感分类的研究,该模型利用卷积神经网络提取句子中高级别的词语表示,将获得的结果输入LSTM得到句子的表示,既获得了词语间的局部特征,又获得了全局的语义特征。3、针对带情感标注的中文文本数据集少的问题,通过网络爬虫的方式收集了六大领域的带情感标注的中文文本数据25000条,用于中文文本情感分类的研究。4、通过网格搜索的方式对超参数进行调节,使模型的训练达到最好的效果。并将三种模型的实验结果进行对比分析,C-LSTM模型确实在分类准确率上有所提高。
其他文献
开展了12根内置高强钢管的圆钢管混凝土柱的轴压试验,考察了内钢管屈服强度、内外钢管净距、内钢管取钢率、废旧混凝土块体取代率等因素对柱轴压性能的影响。研究表明:在总用
本文是国际反兴奋剂实验室委员会最新发布的技术文件,明确规定了在此类检测实验室中对于检测阳性结果定量检测与判定方法,在其附录中推荐3种测量不确定度的评估,以及实验方法
结合铜汤高速公路路面04标抗裂水泥稳定碎石基层的施工实践.介绍抗裂水泥稳定碎石配合比设计、施工准备、试验段铺筑、拌和、摊铺、碾压、养生等施工工艺,总结质量控制要点及经
针对华南地区量大面广的两类渣土(花岗岩风化残积土、冲洪积土),建议用相应的处理工艺;采用处理后的可用渣土部分或全部取代天然河砂以制备水泥砂土浆,考察了基于工作性能的
描述了一个利用MATLAB设计的仿真平台,用于分析Turbo码应用于AM频段数字音频广播系统的性能,简要说明了平台中使用的Turbo码的编、解码算法。利用此平台以DRM(全球数字广播)
美国Byron Jackson公司生产的大钩,由于具有结构设计新颍、使用可靠、性能良好等优点,因此,被认为是美国大钩结构中最好的一个。这种大钩的特点如下: 1.液力缓冲器:BJ大钩液
3月24目,我国民用航空局购买的首台空中客车A320全动模拟机在空中客车中国公司的华欧航空培训中心正式投入运营,这将大大加强我国民航局与空中客车公司的培训合作能力。
【正】 市场上俗称“糠醛”的有机化工产品,它的化学名称叫“呋喃甲醛”,是一种呈微黄色的油状液体,以农、林付产品如棉籽壳、谷壳、玉米蕊、油茶籽壳、向日葵壳、花生果壳等
通过对河北省沿海高速公路秦皇岛段进行重载交通长寿命半刚性基层沥青路面关键技术的研究,提出优化的SAC沥青混合料设计方法,尝试在解决沥青面层的早期破坏问题的同时满足面
本文对ISO协议的传输层通讯规程在文献[1]验证的基础上,使用Petri网工具予以佐证。