线上商品用户评论的情感分析系统研究与实现

来源 :辽宁大学 | 被引量 : 1次 | 上传用户:chunlai_zhang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
现如今,互联网络技术渗透了人们生活的各个方面,网络购物已经成为了一种新的主流购物方式。据统计,半数以上的消费者会对线上购买的商品进行评论。这些评论为生产者和消费者提供了十分重要的参考信息。面对规模庞大的用户评论数据,如何设计出一款高效准确、易于使用的评论分析系统,并将分析后的数据以直观的视角展示出来,是一个热门的研究领域。为了能够细粒度的展示用户评论的情感倾向,本文设计的用户评论情感分析算法,将情感分析问题转化为实体标注问题和情感分类问题。通过BERT预训练模型以及激活函数、优化函数的改进,改善BiLSTM-CRF实体标注算法效果。再通过基于规则的匹配算法匹配主题词和情感词、K-means进行主题词的分类和基于情感词典的情感分类,整合了一套切实可行的算法流程,能够针对商品的不同属性进行商品用户评论的情感倾向分析。本文设计的情感分析系统总体共划分成四大功能模块,其实现基于Python语言,使用Django设计Web框架,通过Scikit-learn和Keras等工具框架实现模型算法,并采用PyEcharts对评论数据的分析结果进行展示。最后通过系统测试验证本系统较好的完成了各大模块的相关功能,满足设计需求。系统的研究设计与实现过程如下:1.系统需求分析阶段:首先确定系统实现目标,对系统的可行性进行分析,再从顶层用例分析的角度对本系统的功能进行详细的需求分析,最后从安全性、易用性、可维护性等非功能需求角度进行系统的非功能性需求分析。2.系统总体设计和详细设计阶段:首先针对系统的整体架构进行设计,再使用HIPO模式设计出系统的总体功能图,并使用IPO表对各个功能模块进行详细设计,最后通过实体属性图和数据表对系统的数据库进行设计。3.情感分析算法的设计阶段:本文提出的基于BERT-BiLSTM-CRF标注模型,提高了主题词和情感词标注的准确率,同时设计了一套情感分析算法流程,通过数据预处理、主题词和情感词的标注、主题词和情感词的匹配、主题词分类和情感倾向分析五大步骤,能够抽取评论的细粒度情感倾向。4.系统的实现和测试阶段:系统编写平台为PyCharm,算法主体部分使用Python语言结合机器学习工具Scikit-learn和高级神经网络Keras API编写,前端功能则使用JavaScript等语言实现。最后使用设计的测试用例对系统进行功能性测试。
其他文献
非事件性新闻也就是我们平时所说的工作报道。军事新闻特别是重大军事行动是广大观众关注的焦点,如1998年抗洪抢险、2005年中俄联演、2008年抗震救灾、2018年海上阅兵等等,电
在全球气候变化问题日益严峻和国内越来越严格的环境资源约束下,中国工业各行业正寻求绿色转型。中国轻工业为十多亿人提供生活消费品,2015年其能源消费总量约3.7亿吨标煤,占
写六行内小诗没有固定的"模式",千变万化,永远处于"难"——"易""易"——"难"的不定式的交替中。写纪念性的小诗是难中之难,要化难为易,必须要捕捉"物象"创造"意象"。"意象"的
目的:探讨颅内血肿微创清除术术前、术后护理。方法:以38例患者为研究对象,对微创清除术进行术前、术后病情观察,术前准备,术后引流管护理,康复指导。结果:38例患者接受手术治疗,37例
2010年9月4日,由中国企业联合会、中国企业家协会主办,安徽省人民政府协办,合肥市人民政府承办的“2010中国企业500强发布暨中国大企业高峰会”在安徽合肥隆重举行。会上公布了2
腰椎斜位片现行的投照体位难以理想显示腰椎斜位影像(人体冠状面与台面呈45°)。原因:①腰椎横突,常向躯干后外方伸展。②双侧椎弓略呈平行状态;对策建议:减少躯干冠状面与台面
“中国制造2025”以智能制造作为未来的主要方向,并且明确定义了制造业的9大主要任务,这给制造业转型升级带来了新的机遇和挑战。十九大报告提出,创新不仅是引领发展的主要驱
2004年8月以来,河南油田在新投入开发的稠油新区引入油公司管理模式,以“三新”(新理念、新体制、新机制)促“三高”(高速度、高水平、高效益),初步建成了“管理体制扁平化、运行机
<正> 在过去的三十年,心内膜心肌活组织检查术(EMB)不断地被改进,为心脏疾病的诊断、治疗及评估预后等提供了可靠的资料。在光镜、电镜组织病理形态学的基础上。同时也对生物