论文部分内容阅读
现如今,互联网络技术渗透了人们生活的各个方面,网络购物已经成为了一种新的主流购物方式。据统计,半数以上的消费者会对线上购买的商品进行评论。这些评论为生产者和消费者提供了十分重要的参考信息。面对规模庞大的用户评论数据,如何设计出一款高效准确、易于使用的评论分析系统,并将分析后的数据以直观的视角展示出来,是一个热门的研究领域。为了能够细粒度的展示用户评论的情感倾向,本文设计的用户评论情感分析算法,将情感分析问题转化为实体标注问题和情感分类问题。通过BERT预训练模型以及激活函数、优化函数的改进,改善BiLSTM-CRF实体标注算法效果。再通过基于规则的匹配算法匹配主题词和情感词、K-means进行主题词的分类和基于情感词典的情感分类,整合了一套切实可行的算法流程,能够针对商品的不同属性进行商品用户评论的情感倾向分析。本文设计的情感分析系统总体共划分成四大功能模块,其实现基于Python语言,使用Django设计Web框架,通过Scikit-learn和Keras等工具框架实现模型算法,并采用PyEcharts对评论数据的分析结果进行展示。最后通过系统测试验证本系统较好的完成了各大模块的相关功能,满足设计需求。系统的研究设计与实现过程如下:1.系统需求分析阶段:首先确定系统实现目标,对系统的可行性进行分析,再从顶层用例分析的角度对本系统的功能进行详细的需求分析,最后从安全性、易用性、可维护性等非功能需求角度进行系统的非功能性需求分析。2.系统总体设计和详细设计阶段:首先针对系统的整体架构进行设计,再使用HIPO模式设计出系统的总体功能图,并使用IPO表对各个功能模块进行详细设计,最后通过实体属性图和数据表对系统的数据库进行设计。3.情感分析算法的设计阶段:本文提出的基于BERT-BiLSTM-CRF标注模型,提高了主题词和情感词标注的准确率,同时设计了一套情感分析算法流程,通过数据预处理、主题词和情感词的标注、主题词和情感词的匹配、主题词分类和情感倾向分析五大步骤,能够抽取评论的细粒度情感倾向。4.系统的实现和测试阶段:系统编写平台为PyCharm,算法主体部分使用Python语言结合机器学习工具Scikit-learn和高级神经网络Keras API编写,前端功能则使用JavaScript等语言实现。最后使用设计的测试用例对系统进行功能性测试。