数据挖掘在淘宝客户评价方面的研究与应用

被引量 : 6次 | 上传用户:cherrychenghui
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
数据挖掘(Data Mining,简称DM)主要是将众多的、冗杂的、存储在数据库中的数据转化成对人们有使用意义的信息的一系列过程。这些潜藏在数据中的信息大多是不可预测的。DM的聚类算法、分类算法、关联规则等算法在各个领域得到广泛应用,例如本文所提到的在电子商务、教育系统、医学领域中的应用。近些年,将DM技术应用到电子商务领域是倍受大家关注的一个研究方向。这也是本文选取数据挖掘在淘宝客户评价方面的研究与应用为题的原因。课题中主要运用到数据挖掘技术中的关联规则挖掘找出淘宝客户评价中描述产品属性的特征词。本文首先分析淘宝网信誉评价体系特点,了解其评价指标以及每个指标具有的实时性和评分标准,以及店铺综合评分的评判指标和评分计算方法。随后从淘宝网用户具体评价入手,利用ICTCLAS汉语分词系统对SQL Server数据库中的用户评价进行逐句分词处理。随即,运用关联规则挖掘算法找出客户评价中描述产品特性的词汇,并提取出与该产品特性词汇相关联的观点词以及观点词的极性。最后,统计出客户对产品以及与产品相关的服务的满意度,为管理者和经营者提供真实可靠的宝贵信息。客户在评价中提到的描述产品特性的高频词汇可视为客户比较在乎的产品属性,对于经销商来说极具有参考价值。同时这也描述产品特性的词汇也是潜在客户比较关注的方面,可以提高客户购买效率也防止电子商务平台的营销欺骗。在本文的最后一章,我们依据以上几章的理论基础和实际考察。选取Visual Studio(简称VS)作为开发环境,C#语言作为开发语言,在winForm中建造UI界面,对于用户来说具有较强的可用性,系统操作简单,且方便易懂。在系统实现的整个过程中,全方位考虑系统的可用性,整个系统分为五个模块:旗舰店信誉提取、客户评价提取、评价文本分析、分析结果展示和旗舰店信用对比。文本分析模块将分类算法与关联规则算法相结合,找出最优分词和词性标注算法,提高系统的准确率。分析结果展示又分为两个模块,来提高软件的可靠性。在本文最后,文本做出总结并对数据挖掘技术和电子商务的发展做出展望。
其他文献
采购业务是企业进行生产活动的首要环节,同时也是生产的准备阶段以及运营资金循环的开始阶段。采购业务直接涉及商品与现金的进出,关系到企业的生产和销售计划的实现,其运行复杂
慢性阻塞性肺疾病(慢阻肺)全球创议系目前最为权威的慢阻肺防治策略,根据慢阻肺领域的进展、重要研究进行即时总结,以年度更新的形式在线发表,并作出推荐,为慢阻肺的诊治提供
近年来,以“稀路网,大街区”为特征的传统空间规划模式不断受到批判,而基于新城市主义规划观念的“密路网,小街区”规划模式在国内新区建设中得到应用。本论文以昆明呈贡新区
目的随着广谱抗菌药物的广泛应用,多重耐药鲍曼不动杆菌不断出现,已成为临床抗感染治疗的难题。由于目前治疗药物的选择非常有限,新型药物的开发显得格外重要。从中药及中药单体
<正>正如许多学者都指出的那样,金文研究不仅要仔细弄懂字词句、解读全文的意思,同时还要对金文的书写文本和书写格式进行研究和解读,究竟时人是在何时、何地、何背景的条件
期刊
在数控技术的发展过程中,数控技术对于人类社会的经济建设,它有着重要的推进作用,在社会经济建设的很多方面都有所应用,数控技术已经成为社会经济建设以及人民的生活中不能够
中国的商业地产还处于发展初期,特别是当前国际化程度的加深对中国房地产行业带来巨大的冲击,中国房地产企业商业地产开发面临着激烈的竞争,而涉足商业地产行业的企业并不完全明
针对装备承制单位外购器材供方出现的一些新情况、新问题,组织人员进行实地质量保证能力考察,对考察中发现的问题提出相应的新对策新举措,进一步严把"源头"质量关。
调节级动叶运行工况恶劣,其承受复杂的激振力,为了调开共振,必须对其频率进行准确的把握。调节级动叶结构复杂,其频率采用常规方法计算及试验均存在较大难度。本文采用有限元