基于深度语义信息的文本情感分析及应用研究

来源 :武汉理工大学 | 被引量 : 2次 | 上传用户:freegfly
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
汽车用户满意度调查能发掘用户对于产品的潜在需求,帮助企业做出正确决策。如今网络上存在海量的用户发表的汽车评论数据,这些数据包含了用户对于汽车的使用体验及感受,对这些海量的在线评论进行挖掘及情感分析可以为汽车用户满意度调查提供理论依据及数据支持。然而,由于文本情感自身复杂抽象的特性,尤其是网络在线文本表达的不规范性及大量噪声的干扰,情感分析仍然面临着情感词库领域覆盖性差、情感特征提取困难及情感倾向分析准确度低等多个问题。  针对上述问题,本文以产品在线评论为研究对象,研究基于语料库的领域情感词库构建、融合情感信息与语义信息的词嵌入模型及基于情感词向量与长短期记忆网络的文本情感分析方法,最后将以上模型及方法应用于汽车领域,设计并实现基于情感分析的汽车用户满意度系统。主要研究工作如下:  (1)基于点互信息及标签传播算法的领域情感词库构建研究。针对传统点互信息方法未考虑语料句法信息从而造成衡量情感词情感关联性存在误差的问题,在传统词共现的基础上,提出一种融合全局信息、局部信息及约束信息的点互信息方法,以更精确地计算情感词的情感关联值,并基于该关联值构建领域情感关联图;针对传统方法中情感值计算受种子词位置影响较大的问题,提出一种基于标签传播算法的情感值计算方法,以获取更高精度的领域情感词库。针对两种领域数据集的实验表明,所提出的方法能有效地提高领域情感词库的F值。  (2)融合领域情感词库的词嵌入模型及基于情感词向量与长短期记忆网络的文本情感分析方法研究。针对传统词嵌入模型在衡量词语相似性时存在词语语义相似而情感倾向不一致的问题,通过融合领域情感词库的方式引入情感信息维度,提出一种融合情感信息与语义信息的词嵌入模型,以提升词向量在情感上的表达能力;针对传统基于机器学习的方法忽略文本语义关系的问题,提出一种基于情感词向量与长短期记忆网络的文本情感分析方法,以充分利用文本深度语义信息,提升情感分析效果。针对词语级及文档级情感任务的实验表明,提出的词嵌入模型具有更强的情感表达能力,提出的情感分析方法能够有效提高F值。  (3)文本情感分析在汽车用户满意度上的应用研究。研究融合文本情感分析与Web技术的模块化分层架构,设计并开发数据采集模块、数据预处理模块及数据分析与统计模块,实现汽车用户满意度系统。系统以文本情感分析的结果为基础,可视化展示汽车用户对各型号汽车及汽车各属性的满意程度。在汽车用户满意度的应用中验证所提出模型及方法的有效性及实用性。
其他文献
短链脱氢酶/还原酶(Short-chainDehydrogenases/Reductases,SDR)家族是一个由很多成员组成的大家族,其中大部分是NAD+或NADP+依赖的氧化还原酶。在本论文第一部分中,我们通过同源
本文将关系类型和自我建构两个变量纳入到消费者赠礼行为的研究模型中,通过两个实验探讨了赠礼情境下礼品品牌形象一致性对消费者礼品选择偏好的影响及其内、外部作用机制,并
这几年,笔者在文言文教学中采用巧用讲学稿的方法来提高文言文课堂教学质量,即讲学稿不是提前发给学生,而是先布置学生预习,接着以检测的形式检查学生的预习效果,然后导学课
本文重点研究了蓝宝石衬底上的铝镓氮/氮化镓(AlGaN/GaN)增强型高电子迁移率晶体管(HEMT)和集成电路。   首先,开展了不同F等离子体处理条件对器件的影响研究,采用一种新的
本文通过对荣华二采区10
期刊
随着光通信技术的不断发展,尤其是密集波分复用技术(Dense Wavelength DivisionMultiplexing,DWDM)的广泛运用,色散补偿技术受到了越来越多的关注。光纤通信系统已经从点对点传输
近年来,随着无线通信业务的不断增加,频谱资源变得越来越紧缺。但是,在现有的频谱资源固定分配模式下仍存在许多未被充分利用的频谱资源,造成了频谱的浪费。为了解决这种紧缺与浪
南方红黄壤丘陵区是我国农业生产发展潜力最大的地区之一,丘陵山地面积占华南地区总陆地面积的70﹪以上.如何促进山区现代农业走可持续发展道路,立足山区实际,选择适宜的山区现
随着后PC时代的到来,嵌入式系统网络化成为必然趋势。但是我国传统的工业监控设备网络化不够完善,如何低成本实现这些设备的网络化是当前研究热点。本文以有害气体为网络监测
登革病毒(Denguevirus,DV)是黄病毒科的单股正链RNA病毒,有4种血清型,均可以引起登革热(Classicaldenguefever,DF)和登革出血热/登革休克综合征(Denguehemorrhagicfever/Denguesh