文本情感分析的算法研究

来源 :长春理工大学 | 被引量 : 0次 | 上传用户:sunuplee
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着我国互联网技术的飞速发展,导致碎片化信息增多,让舆情监测工作面临了新的挑战.越来越多的研究者开始通过情感分析的方式对碎片化信息进行舆情监测工作.针对这一问题本文主要使用机器学习的方法研究解决短文本的情感分析问题和不均衡数据下的多分类多粒度的情感分析问题.在短文本的情感分析问题的研究过程中,提出一种基于卷积神经网络模型和XGBoost相结合的CNN-XGB方法,解决了在互联网评论中短文本居多导致情感分析模型结果较差的问题.CNN-XGB方法主要优势在于通过XGBoost替代CNN模型原有的分类器使CNN-XGB方法的情感分析正确率得到提升.实验结果表明本文提出的CNN-XGB方法处理短文本情感分析问题时与CNN模型对比准确率有明显提升.实验同时证明CNN-XGB方法具有可行性.在解决不均衡数据下的多分类多粒度情感分析问题的研究过程中,提出一种基于seq2seq模型的MO-seq2seq方法解决在多分类多粒度情感分析中因训练数据集不均衡导致情感分析模型准确率较低的问题.MO-seq2seq方法的主要贡献是将原有seq2seq模型解码端直接输出情感分析结果优化为通过两个步骤输出结果.首先获得初步情感分析结果和数据是否为小样本数据,之后结合前一步结果综合考虑最终得到情感分析结果.实验结果表明本文提出MO-seq2seq方法在解决不均衡数据情感分析问题时与seq2seq模型对比准确率有明显提升.实验同时证明MO-seq2seq方法具有可行性.本文提出的CNN-XGB方法和MO-seq2seq方法对解决情感分析问题有一定的现实意义.未来可以结合最新模型对多分类多粒度情感问题进一步进行研究.
其他文献
传统的经典评价方式是以单一的分数为主,不能获得隐藏在量化结果背后丰富的诊断信息,忽略了学生的综合素质和个性发展。而新一轮的课程改革强调要培养学生的学科核心素养,这
无迹卡尔曼滤波器是针对含有噪声和干扰的情况下用于状态估计的最优观测器.它不仅广泛用于整数阶系统的状态估计,而且也广泛用于估计分数阶系统的状态信息.无迹卡尔曼滤波器
设备到设备通信(Device-to-Device,D2D)是一种用户间不需要经过基站转发数据的直接通信技术。在传统蜂窝网络中引入D2D通信,不仅可以提升系统的频谱利用率和吞吐量,还可以降
现阶段我国经济发展迅速,城镇化发展趋势显著。城市可以同时举办大量的赛事,也需要通过赛事来展示城市这张靓丽的名片,需要通过举办大量的赛事来满足城市需求。城市举办的赛
碳纤维(CF)具有模量高、耐腐蚀、抗蠕变、导电等一系列优异的性能,在航天航空、能源、交通等领域都有着举足轻重的地位。但由于其表面呈化学惰性,与树脂基体的界面粘接性能较
航空重力测量系统是以动态平台为载体,通过惯性器件的输出来确定某一地区重力场的设备,航空重力测量比传统重力测量的速度更快,范围更广,成本更低,而且没有空间限制,为构建重
数据VV&C是保证数据质量,提高数据可信性的重要方法。一致性作为其中的一个公认关键指标,用于评估和衡量一个或多个数据集中信息的一致化程度。地形数据是建模与仿真中的一类
驾驶中的分神行为具有频发性和短暂性,易引发道路安全事故。监测驾驶端并及时预警是降低碰撞风险的有效手段。本文选取能反映行驶状态的头部姿势为研究主体,利用深度学习理论
随着社会的快速发展,人们承受着来自各方的压力,患有焦虑症的概率也越来越大。为了及时制定治疗方案,对焦虑症的精准识别就至关重要。但是当下对于焦虑症的识别,大多数只是依
金融产品的可模仿性,使得客户资源成为影响各银行竞争力的最主要资源。而研究表明,客户满意度每增加5%,企业利润将增加25%-85%,因此,良好的顾客满意度已成为商业银行获得持久