基于文本挖掘的在线评论应用研究

来源 :湖北工业大学 | 被引量 : 0次 | 上传用户:mj19830512
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网电子商务的快速发展使得网络购物成为一种潮流,网购给各大电商平台和生产厂家带来机遇的同时也带来了挑战,除了开发、升级产品带动消费外,商家还需要了解用户的心声,才能尽可能满足他们的真正需求,随着网购的兴起,消费者利用网购平台发表自己的购物体验以及对商品、服务等的看法已经成为一种趋势,随之也产生了海量的评论数据,而在这些评论文本中包含着许多有价值的潜在信息,因此通过对商品评论信息的分析,一方面能够为商家发现产品的缺点、提高产品质量、改善服务态度提供有力的依据,另一方面能够让消费者全面了解产品有利于选购。本文的研究对象是笔记本电脑的在线评论数据,首先利用八爪鱼数据采集器采集数据,将京东商城采集到的华为荣耀MagicBook2019和华硕Vivobook超薄笔记本电脑的评论数据作为分析语料;接下来对文本数据进行清洗和预处理,包括文本去重、中文分词、去停用词等,然后将处理后的文本向量化,表示成计算机能够识别的结构化数据。在本文的情感倾向研究过程中,考虑到监督学习方法需要已经标注好的文本,所以本文采用构建词典和机器学习相结合的方法,既解决了人工标注的繁琐问题,同时加入了支持向量机、K近邻以及朴素贝叶斯三种文本分类算法进行算法比较,先对训练集建立分类模型后将模型应用于测试集中,通过查准率、召回率、值三个指标对分类器做评估,根据实验结果得到最优的分类器为支持向量机;同时本文还对消费者评论数据进行了特征分析,利用词云图可视化技术对产品的特征有了一个初步认知,然后对两款笔记本电脑的正面评论和负面评论分别建立LDA主题模型,利用主题向量之间的余弦距离,通过R语言编程求解得到最优的主题个数,在此基础上归纳出消费者对商品的看法,发现消费者主要关注的是电脑运行速度、外观、便携性、系统、性能、屏幕显示效果以及售后服务等属性。最后结合文本挖掘分析结果的差异性,针对性的为两个品牌的生产商提供可行性建议,同时根据电脑的优劣差异为消费者购买决策提供一定的参考。
其他文献
<正>11月18日上午,第十七届中国黄山国际旅游节暨徽文化节和2013年全国群众登山健身大会暨第九届中国黄山国际登山大会开幕式在黄山风景区南大门隆重举行。省政府副省长花建
会议
目的:总结重症药疹的临床护理方法。方法:20例重症药疹患者实施临床护理。结果:20例均痊愈出院。结论:对重症药疹患者实施临床护理有明显效果。
细胞的物质输入与输出的方式多样,其机制又非常复杂,但中学教材对这部分知识介绍得却很少。本文对人教版高中生物学教材此部分内容进行了适当的补充,以利于师生更好地理解该
随着互联网的快速发展和普及,传统的广告行业与互联网进行结合,使得在线投放广告成为可能。实时竞价系统,作为现有互联网广告投放的重要渠道,在学术界和工业界中备受关注。在
随着经济增长速度的持续放缓,我国需要从供给侧进行改革,从根本上解决竞争力不足的问题,推动实体经济企业转型,带动经济发展。在国际竞争中,低成本会为经济发展带来竞争优势,
软件无线电已经成为目前无线应用领域中一个非常重要的研究课题.它采用的用软件实现多波段、多模式无线通信系统的技术将成为解决全球化通信的重要技术和方法之一.当然要采用