面向用户评论的情感分析研究

来源 :海南大学 | 被引量 : 0次 | 上传用户:nihaochaochao
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息媒体的加速传播,网民数量大幅增加,网民更倾向通过互联网的平台表达自己的观点,表达方式以文本评价的方式居多。对评论文本语料进行情感信息任务的研究,可以帮助用户快速判断网络文本信息,提高用户对产品的使用体验。在文本情感分析研究发展的初期,主要借助情感词典和规则的方法与机器学习方法。随着文本形式的数据不断增多,情感呈现方式的丰富,传统情感分析的方法在处理文本分类的任务时,难以达到预期的效果,模型的泛化能力也难以保证。近些年来,文字情感分析的技术与手段越来越完善,在处理情感分类任务时,对情感极性的判断也越来越准确,不过仍然存在着不少挑战与问题。传统的深度学习方法难以处理稀疏数据的重要特征,同时在对评论文本语料进行向量表示时,文本语义信息的提取方法也有待提高。本文在查阅大量文献的基础上,对上述的问题进行思考与研究,主要开展的工作内容如下:(1)提出了双通道的Bi LSTM和Transformer模型(DC-Bi LSTM-Transformer),在对评论文本数据进行情感分析时,为了丰富对评论文本语料的向量表示,在输入序列时,采用了Word2vec模型和Glo Ve模型,将微博评论文本语料分解,提高输入信息的质量。针对Bi LSTM难以捕捉句子中长距离的关系依赖,且不能实现模型的并行运算这一问题,在对词向量进行特征提取时,采用基于深度学习的Bi LSTM和Transformer两个模型,对带有情感信息的词向量进行训练,通过模型对文本信息进行情感极性判断,模型的准确率有了一定的提升,增强了模型的并行计算能力。(2)为了在对文本语料进行情感极性判断时,增强模型对关键位置信息的关注度,提出了结合自注意力机制的双通道Bi LSTM和Transformer模型(DC-SA-Bi LSTMTransformer),进行评论文本数据的情感极性判断。在对评论文本语料的情感信息研究中,在关键位置加入自注意力机制,给与关键位置信息更多地关注,可以增强模型的学习能力,获取更丰富的语义信息,提高对文本数据特征提取的效率。(3)验证本文提出的文本信息的情感极性判断模型的有效性和实用性,将本文模型在微博评论文章数据集上进行了试验,并与现行的传统文本情感极性判别的方法进行比较实证研究。经过将试验的结论加以多次比较研究,可以看出:本文提出的模型在准确率、召回率和F1值这三项测量数据上,相对于文本情感极性判断的基线模型已经有了一定幅度的改善,进而证明了模型的有效性和实用性。
其他文献
区块链技术是分布式信息技术领域的成功应用,这项技术在各行业领域已经得到了广泛的认可。区块链技术为解决传统的中心化模式中所面临的用户信任、单点故障等问题提供了新的思路,并借助星际文件系统(Interplanetary File System,IPFS)等分布式存储系统以降低区块链数据的存储成本。但IPFS本身并不具备数据加密保护功能,提交至IPFS的数据将对所有参与节点公开,区块链环境下的IPFS数
学位
异常检测已经应用于生活中的各个领域,例如航天航空技术的异常检测,服务器性能负载的异常检测和视频流量的异常检测等领域,船舶轨迹的异常检测也被研究者们高度重视。船舶轨迹的数据以时间序列的形式存在,其中使用最多的就是船舶自动识别系统数据(AIS)。现阶段基于AIS数据的研究在计算机领域和海洋领域都有了诸多硕果。传统的船舶轨迹异常检测方法主要有以下几种:基于连续概率分布的方法、基于连续Cholesky分解
学位
微服务架构是一种新的软件架构风格,它提倡将单体应用程序划分成一组小的服务(称之为微服务),每个服务运行在独立的进程中。微服务高内聚、低耦合、高可用、可伸缩等优点使得多服务应用架构逐渐成为IT应用交付的基准。然而,组件之间繁多且复杂的交互使得微服务性能异常诊断充满挑战性。如何设计一种适用于微服务架构的性能异常检测和根本原因定位方法是服务计算领域当前研究的一个热点。目前学术界已经提出了许多针对大型微服
学位
近年来,最高法院联合各级下属单位发布了大量规范化的裁判文书。法律案件裁判文书是法学界颇具研究价值的文献,对于广大法律研究者来说也是宝贵的研究材料。与此同时,随着自然语言处理技术的发展,为了提高司法从业者的办案效率,将人工智能技术应用在司法领域已逐渐成为一种趋势。相似案例匹配作为人工智能支持司法审判的重要内容,对提升法院的整体审判水平、实现类案适法统一、促进司法公正有着重要的积极意义。相似案例匹配属
学位
场景文本检测与识别的目的是从场景文本图像中定位并识别出计算机可使用的文字,在实时翻译,机器人导航等场景中有着广泛应用,有着很大的研究价值。自然场景的文字受到场景,光照变化以及噪声的干扰,使得传统的文本文档检测识别算法效果不佳。随着深度学习的发展,基于深度学习的场景文本检测与识别算法已经取得了很大的突破,但仍存在着许多问题,对于检测来说,目前算法针对任意形状文本做出的相关改进需要复杂的标签生成和后处
学位
近年来,随着互联网和多媒体技术的飞速发展,数字信息以图像、视频、文字等形式广泛传播,而图像作为多媒体数据的重要载体,在传输过程中易被非法获取或篡改。图像数字水印技术是保护图像产品版权和维护信息安全一种有效方法,其可以在不影响视觉效果的前提下,将标识信息嵌入到图像数据中,进而实现版权保护和篡改检测。目前已有研究者们提出鲁棒脆弱多水印算法同时实现版权保护和篡改检测,但目前的多水印算法仍存在一些不足:(
学位
知识图谱是一种组织和管理大量数据最有效的方式,它能够提高人们对信息管理智能化水平。在构建特定领域知识图谱时,数据表达能力是体现知识图谱质量的指标之一。因为实体和实体间的关系是作为构建知识图谱的基本元素,所以从一个句子或者段落中提取出实体以及实体间的关系就显得特别的重要,而且实体间的关系是知识图谱对知识数据表达的重要体现。在目前的知识图谱数据资源描述框架下,通常是每一条关系都用简单的文字语言标签来进
学位
轨道交通装备作为一种典型的复杂、高端定制产品,其研制周期长、制造过程高度离散,在其供应链中涉及大量的新增供应商,因此,如何有效评估供应商就成为一个关键问题。传统对于供应商的风险评估缺乏效率与实时性,供应链上的供应商不计其数,大多数对供应商的判断是基于人工的评审。除去定期开展会议的繁琐外,人工干预缺乏实时动态性,并且易掺杂不公平、不公正的主观因素。尤其是近年来全球发展高度不确定,政治、经济等突发事件
学位
随着人们对海洋资源和海域的愈发重视,海洋的战略地位已经成为各国的重要战略内容。水下无线传感器网络由于其在海洋环境监控、海域安全、海洋资源开发等重要领域有重大意义,各国越来越重视水下传感器网络的研究。水下无线传感器主要部署水下环境中,容易受外部环境的影响、人为恶意破坏和一些不可控因素的影响产生异常数据。传感器的不稳定性,也会产生异常数据。另外,传感器采用水声通信的形式进行传输与通信,水声通信具有传播
学位
鼻咽癌是指发生于鼻咽腔上皮组织的恶性肿瘤,是中国南部和东南亚常见的恶性肿瘤之一。对于大部分鼻咽癌患者,采取放射线照射肿瘤细胞是有效的治疗手段。在电子计算机断层成像(CT)中准确分割鼻咽癌靶区和危及器官是放射治疗计划的关键步骤。目前,深度学习在鼻咽癌靶区和危及器官CT图像自动分割进行了广泛研究,但其分割准确性仍受到多种因素的限制,在实际临床应用中仍充满挑战。在鼻咽癌靶区CT图像中,由于CT图像平面间
学位