论文部分内容阅读
企业的产品规划和产品定位首先需要获取用户的真实需求,准确的获取用户的需求能够在市场上占据有利的地位,是产品成功的决定性因素。随着当今互联网技术的快速发展,网络购物平台上每天都会产生庞大的用户生成数据,这些数据包含了大量的用户偏好、用户购买行为和用户对产品的需求信息,这些信息已经逐渐成为用户需求研究极为重要的数据资源。传统的用户需求获取研究还存在许多不足,本文以华为Mate30系列手机用户评论数据为研究内容,应用文本数据挖掘技术与Kano模型相结合,从而分析用户的真实需求,对企业的产品提升和改进有着重要的意义。首先,本文阐述了互联网时代下研究用户在线评论的背景和意义,根据研究的背景和意义总结出本文的研究目的。并从用户在线评论有用性、特征提取、情感分析以及在线评论用户需求研究四个方面介绍了相关的文献综述,为本文后续的研究提供参考。其次,研究了本文所应用的相关理论,包括网络爬虫技术、文本挖掘技术、VSM分类算法、K-Means聚类算法、Kano模型以及用户需求Kano模型的一般流程,为后续研究提供理论基础。然后,以淘宝网和京东商城华为Mate30系列手机的用户在线评论数据为实验数据来源,运用网络爬虫技术获取在线评论文本数据,首先进行数据预处理,利用Python中的jieba分词工具,结合停用词库对数据进行分词处理,采用TF-IDF算法对产品特征词库进行构建,得出用户对产品特征的关注方向主要在系统、网络、通话、短信、电池、外观、屏幕、摄像、内存、娱乐、系统、品牌、按键、服务等方面,应用目前比较全面的知网情感词典作为本文主要情感词库的构建,并结合大连理工大学中文情感词库、简体中文情感极性词典NTUSD作为补充,构建情感词库,并与特征词库匹配进行情感分析,分析用户对产品的情感表达。最后,通过构建的用户需求Kano模型,确定了用户在线评论分析的一级指标为用户的评论内容深度和评论影响力,并对各一级指标的各二级指标进行K-Means聚类分析,结合Kano模型的组成要素:基本型需求、期望型需求、魅力型需求以及无关需求的内涵,分析出用户的真实需求,实验结果表明,用户需求Kano模型对用户的基本型需求、期望型需求、魅力型需求和无关需求能够有效的识别。并对以上需求进行分析,提出产品的改进建议。