论文部分内容阅读
随着电子商务的高速发展,贸易金融网络和信息网络被有机的结合在一起。国内国外,各种电子商务网站层出不穷,人们越来越习惯在网上进行购物。同时,由于商品以及相关信息数量的急剧增加,人们为了购买合适的商品,往往需要花费大量时间和精力来过滤网上的各种垃圾和冗余信息。近年来,随着数据挖掘技术的逐渐成熟,各种信息分析推荐技术和商品导购系统应运而生,他们能够方便用户购买,提高网站营收,增加用户忠诚度,降低企业损失,通过低成本创造更高的利润。本课题来源于实习公司的实际项目,采用web挖掘技术,以及基于信息分析的推荐技术,使用迭代式开发的方式展开研发工作,实现了一个支付产品导购系统。本项目分为信息采集、信息结构化抽取、情感分析、导购方案决策四个子系统,完成对商品信息的爬取,储存管理,提取信息显式和隐式主体,情感倾向分析,聚类分析等功能。本人参与了全部四个子系统的设计与实现过程。信息采集子系统的主要工作是进行商品信息爬取以及商品信息的管理。信息结构化抽取的主要功能是对信息进行过滤,从信息中抽取出评论信息主体和评论信息内容。情感倾向分析子系统完成评论内容的情感倾向分析,并依据情感倾向分析值进行聚类计算。导购方案决策子系统则通过综合计算,依据用户偏好为用户提供导购方案。作者通过建立过滤规则完成对商品信息的降噪,建立了映射词典用于非显式评论主体和其评论内容的匹配。构建了一个基于hownet词典的情感词典,方便进行评论内容的情感倾向分析。创建了商品属性树模型,基于此使用多属性决策算法为用户形成一个可靠的商品导购方案。目前,项目的功能已经基本实现,在公司内网良好运行,待项目全面调优后会进一步推向市场。本项目将为公司支付产品的用户提供导购服务,对于提高用户服务质量,提高产品流量,增强产品粘性产生重要推动作用。