基于文本挖掘的家具用户潜在需求可视化研究

来源 :南京林业大学 | 被引量 : 4次 | 上传用户:michaelgang1
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
家具行业作为支柱性产业关乎国民生活,传统家具行业的萧条使得家具电商崛起。家具电商受限于家具产品自身的特殊性,在激烈的竞争环境下面临着诸多挑战和困境。大数据时代和电商平台蓬勃发展的背景下,用户在电商平台购买家具后,会在该平台上发布网购评论,评论的内容包括产品属性、服务、物流等方面,里面都暗含着用户对产品的改进需求。家具电商如果能快速掌握网购评论中的用户需求,就能及时改进现有的产品和服务,并找到产品的未来发展方向,为快速迭代找到灵感,从而牢牢把握用户黏性,提高核心竞争力。本文在文本挖掘和用户需求等理论与关键技术研究的基础上,提出了一套适用于线上家具网购评论的文本挖掘的流程,初步构建了家具网购评论的评价指标,并通过实际案例来验证了本文方法的可用性且得到了有价值的结论。通过实证分析,结合网购行为过程的分析及用户群体研究对线上家具产品的网购评论进行深入挖掘,分析得出用户的潜在需求并提出改进建议,验证了线上家具用户需求分析的可行性。本文主要研究工作具体如下:第一,构建基于家具网购评论的评价指标。通过对家具的行业背景和产品种类及特点进行相关调研来确定研究对象,构建二级评价指标体系,提出评论内容、评论者两个一级指标,据此提出了网购评论涉及产品客观属性且为正面评论可能对网购评论的有用性程正向影响等相关假设,以便后面进行验证。第二,提出适用于家具网购评论的文本挖掘的流程。从定义、发展进程、主要研究领域及相关应用等方面对文本挖掘做学术研究和行业应用现状梳理,初步建立了一套适用于家具网购评论的文本挖掘的流程,最后罗列出现有的文本挖掘工具,进行优缺点分析,从而确定本文选用的Python作为文本挖掘工具,借助PyCharm编译器编写相关程序。第三,对家具的网购评论进行深度挖掘,得出有效的用户需求信息。采用数据获取及预处理、特征词提取、情感分析等方法和技术。具体而言,首先研究了数据获取的相关方法和流程,通过选取在线上销售家具的购物平台为数据来源,以家具产品的近期网购评论为样本数据,使用MongoDB数据库将爬取到的数据存储至并使用Jieba分词工具进行网购评论的预处理;其次研究了文本特征抽取以及文本特征评价方法,利用TF-IDF算法对采集到的家具网购评论进行关键词抽取,得出相关高频次关键词,通过对关键词抽取进行共现分析,借助DataFrame获取共词矩阵表格,进一步提高准确性,并借助Worldcloud生成词云图、Networkx构建语义网络图进行可视化呈现;然后研究了情感分析的相关理论并罗列了现有的情感分析技术,选取SnowNLP作为本文研究的情感分析工具,计算出相关家具产品的每条网购评论的情感值,了解用户的态度和意见,并借助ECharts做出动态的交互图表;最后研究用户需求、网购行为的过程,从而得出线上家具用户需求分析的步骤,并结合线上家具用户群体研究,进一步分析家具用户需求的潜在需求,初步验证了网购评论的评价指标以及线上家具用户需求分析方法的可行性。
其他文献
不管少壮还是年迈,不管富有还是贫穷,所有人都有一个共同之处,那就是每天拥有多少个小时。如何在不同的活动间分配这24个小时,是幸福的关键决定因素。工作一生活平衡,是指“一个个
中央确定2012年为基层组织建设年,这是深化创先争优活动的重要举措,是加强基层党组织建设的重要机遇,旨在把创先争优活动和基层组织建设年融为一体,以创先争优为动力加强基层
本文通过建立矿物的物理模型进行研究,分析了不同的孔隙度、泥质含量和扁率值对纵横波速度的影响。利用筠连地区地质矿物进行横波预测,最大误差5%,平均误差3.5%左右。根据在
正安县“党群连心户”通过串门、谈心、拉家常等形式,很好地解决了一些基层党组织、政府部门在社会管理和服务方面存在的实际问题,群众有困难、有矛盾、有诉求,他们对口帮助解决
认知诗学的概念隐喻理论和意象图式理论为复杂的诗性隐喻提供了从认知切入的崭新的研究视角。传统的隐喻修辞研究关注的是喻体和本体的相似性以及隐喻在诗歌中的功用,认知诗学
随着技术的发展,鱼眼相机逐步走入人们的视野当中,鱼眼镜头凭借其成像更大,拍摄效率更高的优点,近年来发展快速,在许多领域都有很好的前景。但是鱼眼相机在众多领域中还处于
推进高职教育人才培养模式改革是顺应市场经济发展的内在需求。本文基于“1+X”职业技能等级证书带来的契机,以“岗证赛课研”五位一体的课程体系建设为导向,探讨如何变革现
“管控分歧”是适应中美关系新变化而提出的一种处理双方分歧的新理念和新思维。“管控分歧”的前提是承认分歧的存在,并敢于面对分歧。其基本思路是通过中美双方的共同努力,
针对以数据为中心的开放信息系统,亟需能够保护隐私的细粒度自适应访问控制,并平衡隐私保护与数据访问效用间平衡的问题,提出了一种面向隐私保护的多参与者理性风险自适应访问控制模型。该模型基于香农自信息提出了动态访问数据集的隐私量化方法,构造了访问请求隐私风险函数和用户隐私风险函数;进一步基于演化博弈在有限理性假设下构建多参与者的访问控制演化博弈模型,利用复制动态方程分析了访问控制参与者的动态策略选择,提
岩土物理力学参数对于土木建筑工程设计、施工来说是很重要的,不仅关乎工程建设的质量安全,而且与结构设计选型、成本和工程进度密切相关。这些参数一般通过岩土工程勘察过程