基于文本挖掘的电商用户评论分析与系统实现

来源 :东南大学 | 被引量 : 18次 | 上传用户:kof8697
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
文本挖掘和情感分析技术在电子商务中具有重要作用。通过分析电商平台的用户评论数据,挖掘其中包含的用户情感信息,既可为企业提供更精确的数据统计、广告推送和商家商品排名,也可为用户选购相应商品时提供有价值参考。目前中文情感词典不完善、基于词典的文本情感分析方法通常仅基于情感词出现的频率,导致分析结果准确度低。本文研究基于文本挖掘的电商用户评论分析与系统实现,研究具有重要的理论和实际意义。本文以电商网站的评论文本数据为研究目标,从情感词的提取、情感词库的构建以及电商网站评论文本的情感值计算等方面对基于词典的情感分析方法进行了研究。论文的主要工作包含以下几个方面:(1)针对目前通用情感词典过于泛化和领域适应性弱的缺点,本文提出一种基于依存句法抽取情感词的方法。通过对淘宝网历史评论数据进行依存句法分析,挖掘出包含用户情感倾向的依存关系,建立规则表;根据规则从大量历史评价语料中抽取情感词;基于半自动方法构建适合电商领域的情感词典;基于词语相似度进行自动情感极性标注和基于人工干预的情感极性标注,建立面向电商评论文本的情感词库。(2)针对目前仅基于句子中正面情感词和负面情感词个数判断文本情感倾向算法分析准确度低的问题,本文分析了中文文本中否定词、程度词和连词等对文本情感的重要影响,建立相应的辅助词库,提出一种综合计算文本情感极性值的计算方法,提高文本情感分析的准确率。(3)最后,基于上述研究设计并实现了电商用户评论分析系统的原型,使用淘宝网手机类商品的大量评论数据进行评测,最终获得了 90%以上的准确率,验证了该方法的可行性与准确性。
其他文献
<正>虽然全球笔记本的出货量持续下滑,但作为笔记本的一个分支,游戏本却呈现逆袭之势。究其原因,则是更多用户青睐于选择相对轻薄且性能强悍的游戏本作为家里的唯一一部PC。
期刊
鉴于住宅中危害最大的险情以及安全保障的迫切需要,针对非法入侵和火灾检测,设计了一款家庭安全报警器,系统实现了布防、撤防的设置,温度、烟雾、入侵的检测,设置了可直接判
在文明史的大视野下,国家形态的变迁与财税法的发展呈现出交相辉映的互动态势。从静态的角度看,财税法在不同国家形态下被赋予不同的功能、表现出不同特征;从动态的角度看,在
推荐系统广泛地应用在网络平台中,推荐模型需要预测用户的喜好,帮助用户找到适合的电影、书籍、音乐等商品.通过对用户评分和评论信息的分析,可以发现用户关注的商品特征,并
随着互联网的不断发展,人们对网络的依赖性越来越强,对网络速度的要求也越来越高。由于广域网加速技术可以显著提升用户网络体验,因而成为人们关注的焦点。文章简要介绍一些
广西大新地区位于华南板块南华活动带右江褶皱系西大明山凸起,大新凹断束,那岭—俸屯褶断地垒的北端,辉绿岩脉沿断裂呈北西向零星分布。该区产有铀矿、铅锌矿等矿产资源。前
随着网上购物的发展,网上购物所产生的评论越来越多,而电商网页上的初始评论是一条条句子的形式,错综复杂,形式不易分析,内容上更难以直观的找出有价值的信息,因此,如何利用
随着时代的进步和科技的发展,人们的生活水平和生活质量不断提高,人们对工程建设项目的质量要求也越来越高,在给工程建设行业带来机遇的同时也带来极大的挑战。万丈高楼建设
次声现已被广泛的应用于监测领域,如监测地震、火山爆发等。相对较低的声衰减率使得次声(1~20Hz)能够在大气中传播很长的距离。此外,从蓬勃兴起的次声台站实时传送的数据有利
我国是一个矿产资源大国,对矿产资源的开发和利用历史悠久,我国的一部分地区实现经济快速发展与矿产资源的开发和利用密不可分,因此,矿区成为了这些地方的特有地区,磷矿开采