数据挖掘技术在网店商品推荐的应用研究

被引量 : 0次 | 上传用户：coldcoffee_10

【摘要】

：

在当前的电子商务平台上,存在着成千上万的各类分支的网店,对于每家网店来说,仅仅提供一种产品是远远不够的,至少需要陈列多种商品才能满足多种需求的多个消费者,为消费者提

【作者】

：

郝佳

【发表日期】

：

2015年期

【关键词】

：

推荐系统协同过滤用户聚类项目聚类 Web挖掘

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

在当前的电子商务平台上,存在着成千上万的各类分支的网店,对于每家网店来说,仅仅提供一种产品是远远不够的,至少需要陈列多种商品才能满足多种需求的多个消费者,为消费者提供更多的选择。推荐系统利用电子商务网站向客户提供商品和信息来帮助他们决定购买哪些商品,推荐信息一般位于网站的顶部,包括内容有消费者的访问统计数据,或者是通过分析消费者的过去购买行为来预测一个新的购买意愿。推荐的信息还包括针对消费者提供的个性商品、总结其他消费者的意见和评论。数据挖掘是针对大量的数据利用数学分析的方法得出数据中存在的模式和趋势,进而发现有益信息的过程。Web挖掘与数据挖掘密切相关,从大量数据发现知识过程无需人工干预。web挖掘知识的数据来源来自互联网。信息过滤系统使用web挖掘技术针对两种类型的网络数据:基于内容的过滤系统抽象知识来自web文档,而协同过滤系统使用网络用户的信息。为解决协同过滤中的可伸缩性和数据稀疏问题,本文提出的推荐系统解决方法是采用用户聚类技术和项目聚类技术相结合。用户聚类和项目聚类技术工作是识别具有类似评价的的用户组和项目。一旦创建集群,通过计算集群的平均意见可以预测目标用户评级。在某些聚类技术中用户会分散在多个聚类,聚类算法可以生成固定大小的分区,或基于一些相似性阈值会生成符合需求大小不同的分区数。预测的结果对整个聚类按照参与程度进行加权平均。结合用户聚类和项目聚类的协同过滤更具可伸缩性,比传统的方法更准确。本文设计的推荐系统首先收集用户和项目的相关信息,包括用户个人信息、用户浏览商品的历史信息、用户对商品所作出的文字评价和评级信息、电子商务商品的基本属性信息、商品交易记录信息和该商品所获得的文字评价和评级信息。对所收集的用户和项目信息做基本的数据预处理,然后利用用户聚类和项目聚类算法做协同过滤,对未评级商品做预测评级,并以网页的形式发送推荐信息给服务器,最终显示在用户浏览器上。系统测试是从所收集的数据集中选择近万条数据作为训练数据集,大约包括了近千名用户对大约2000本书的评级,并形成数据库中的数据表。对推荐系统预测行为设计的评测指标为准确率和平均覆盖率。经过数据表导入、数据预处理、参数设置、用户聚类、项目聚类、综合分析、推荐测试和结论验证多个步骤测试后,证明本文设计的电子商务推荐系统基本满足需要。为提高推荐系统的实用性,本文最后设计了图书推荐系统应用平台,应用平台设计为前台和后台两个部分,其中前台网站功能有用户登录注册、历史查询、在线推荐、商品评级、商品评论等。后台管理包括有推荐管理、用户管理、图书管理和购物车管理。其中的重点管理功能为推荐管理,其他三项管理功能为辅助设计。管理员每隔一段时间后,通过图书管理查看没有评级信息的图书,利用推荐管理功能,首先设置推荐算法,然后设置用户相似度阈值、项目相似度阈值等数值并对未评级图书作出推荐评级预测;数据管理是对所收集的图书和用户的相关数据进行预处理;推荐评级管理可以查看并管理由本文推荐系统对未评级图书所作出的预测评级。

其他文献

浅析社会化媒体与网络公共领域的构建

自汉娜阿伦特提出公共领域理论,经过哈贝马斯的详细阐述后,公共领域理论便逐渐深入到欧洲主流思想的体系中了。公共领域的形成和传播媒介的发展密不可分,随着社会化媒体的出

期刊

公共领域社会化媒体网络公共领域构建

瘢痕疙瘩形成机理研究进展

病理性瘢痕包括增生性瘢痕和瘢痕疙瘩。其中,瘢痕疙瘩是皮肤损伤后引发的胶原异常积聚所致的过度瘢痕化,与增生性瘢痕不同,表现为过度生长,超过原伤口界限,侵犯邻近组织,呈瘤

期刊

瘢痕疙瘩体外培养增生性瘢痕动物模型胶原合成成纤维细胞病理性瘢痕形成机理

关系学的逻辑及其运作——兼评《礼物、关系学与国家》

关系作为一种实践方式和文化特质,无论在日常生活中还是在国家运作中都有着重要的意义。在《礼物、关系学与国家:中国人际关系与主体性建构》一书中,杨美慧教授从一个局外人

期刊

关系学礼物反思

粉土底基层加固及施工技术研究

本文通过分析当前常用的路面底基层的稳定土加固方案，通过系统的试验，针对邯郸地区低液限粉土，提出了稳定加固方案。同时，分析研究了加固机理及影响因素，通过对试验中稳定土的力学

学位

稳定土粉土底基层质量控制

EFDC模型在河口水环境模拟中的应用及进展

EFDC(Environmental Fluid Dynamics Code)是EPA最为推荐使用的水质模型之一，使用范围较广泛，能够模拟河流、湖泊、河口、水库、湿地和近海区域等多种水体的三维水流、泥沙迁移

期刊

EFDC模拟河口应用进展

前海湾填海区的水龄特征及改善措施模拟

根据实际观测潮流与前海湾填海前后海域范围和海底地形条件,建立前海湾环境流体动力学模型(EFDC),以水龄作为水交换能力的评价指标,利用EFDC模型中示踪和水龄模块模拟计算前

期刊

水龄前海湾EFDC水交换数值模拟

北京市不同功能区空气负氧离子及影响因素研究

空气负离子浓度与空气环境质量密切相关,以北京市3类功能区8个观测点为监测对象,研究空气负离子浓度变化规律及温度、湿度、晴天、阴天对空气负离子浓度的影响。结果表明:交

期刊

功能区空气负离子影响因素空气质量北京

八正散加减治疗肾盂肾炎女性菌尿67例情况分析

<正> 肾盂肾炎是常见的泌尿系统感染性疾病,而女性由于生理上的因素,发病率较男性为高,男女比例为1.6:8。我院中西医结合病区,数年来收治了大量的肾盂肾炎患者,其中辨证为湿

期刊

肾盂肾炎八正散加减

上海轨道交通L13世博大道站地下结构局部清除改建设计

在城市地下空间开发的过程中,极有可能遇到既有地下结构局部侵入拟建工程的边界内,成为拟建工程的地下障碍物。设计需要对既有地下结构进行改建、清障,以及将新旧地下结构连

期刊

地下结构改建连通钻孔咬合桩清障

用马克思主义中国化最新成果武装大学生的有效方法

用马克思主义中国化最新成果武装大学生关键在于五个方面,即:加强党的领导,规范媒介引导,强化教师指导,努力培养向导,夯实热心辅导。

期刊

马克思主义中国化最新成果武装大学生领导引导

数据挖掘技术在网店商品推荐的应用研究

与本文相关的学术论文