SNS背景下基于相似度融合的电子商务推荐系统数据稀疏性问题研究

来源 :中国科学技术大学 | 被引量 : 0次 | 上传用户:wll20071002313
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着电子商务网站的发展壮大,如何快速搜索顾客需要的产品信息成为一个难题,由于推荐系统可以将信息主动推送给顾客,所以推荐系统在电子商务网站的成功应用促进了电子商务的进一步发展。关于推荐系统的学术研究一直是数据挖掘领域的一个热点,并产生了很多研究成果形成有效的推荐算法,像基于内容的推荐、协同过滤推荐、基于规则的推荐、基于人口统计信息的推荐、基于效用的推荐、基于知识的推荐和混合推荐,这些方法各有千秋,其中要属协同过滤推荐的应用最为成功,并且关于这一推荐算法的研究也是最多的。但是随着电子商务的迅猛发展,协同过滤推荐系统也面临着一些难以避免的瓶颈问题,包括数据稀疏性问题、冷启动问题、规模性问题、推荐实时性问题和隐私安全性问题,而冷启动问题事实上就是数据稀疏性问题的升级,当系统刚刚上线使用时都会面临冷启动问题,所以数据稀疏性问题是协同过滤推荐系统的一个研究热点。   本文也是针对协同过滤推荐系统的数据稀疏性问题提出了一个改进算法,即基于Rating和Tag相似度融合的协同过滤推荐(简记为CFSFRT)。随着Web2.0时代的到来,社交网站也如火如荼的发展起来,标签Tag的成功应用正是源于美味书签网站Del.icio.us的迅速发展。本研究正是以社交网站作为研究背景,利用可收集的标签Tag信息作为补充,降低数据稀疏性的影响,提高推荐的质量。   CFSFRT算法首先对收集的标签Tag进行去噪预处理,得到热门标签集合,然后再根据改进的词根还原算法进行标签聚类处理,得到聚类的标签集合。然后根据传统协同过推荐算法计算用户之间基于Rating信息的相似度,然后再利用Tag信息计算用户与标签之间的相关度并建立用户-标签相关度矩阵,并据此计算用户之间基于Tag信息的相似度,再将这两种相似度融合得到综合相似度,最后根据这个综合相似度进行协同过滤推荐。文章最后给出了具体的实验设计,并以MAE作为评价标准,实验结果证明了CFSFRT算法能有效提高推荐的精度。
其他文献
科技型小微企业是经济发展载体,在创新创业、吸纳就业等方面发挥重要作用。在大数据发展程度不断深化的情况下,本文通过分析和研究贵州科技型小微型企业的经营和发展实际情况,发现和总结影响其成长的因素,以及这些因素在贵州经济增长和经济结构调整中所发挥的作用。本文解决的现实问题就是贵州省科技型小微型企业可持续成长的问题,通过分析和研究相关的理论依据,通过利用结构方程模型,试图发现和总结影响贵州省科技型小微型企
近年来,住宅建筑节能改造日益受到国家的重视,政府加大了住宅建筑节能减排力度并制定节能改造工作任务,一些地方由政府出资对住宅建筑实施节能改造。但由于政府财力有限,难以完成
新中国成立后的第二年,新华社实行全国组织上的统一,为了担负起国家通讯社的任务,全社开展了一个练笔运动。这次练笔运动对我们青年记者帮助很大,直到今天,我还铭记在心。从
一九四七年三月二十五日下午,美国森特雷利亚五号矿发生了煤尘爆炸,一百十一名矿工当场丧生。事故发生之后,《圣路易士邮报——信使报》立即派出一个阵容强大的记者组赶赴现
安全事故的发生是一个复杂的动态过程,系统的崩溃是其内部一系列因素相互作用的结果。因此揭示建筑施工安全事故发生的根本原因,首先需要构建能够揭示安全事故发生的系统模型,进
长期以来,我们报纸上的民族报道,存在着相当严重的公式化、概念化的毛病,反映民族地区的成绩和变化,常是一、二、三、四,现象罗列。在表现手法上,也存在一种简单化的倾向,例
消费者对生鲜产品要求越来越高,迎合人们需求是电商发展的必然要求。但由于生鲜电商品易变质、易损耗等特点,目前尚无国家标准对其退换货服务做出明确要求,使得生鲜电商品质量受
当今时代,知识已成为生产要素中的一个重要的组成部分,以知识为载体的知识型员工成为知识型企业的核心资源。在竞争日益激烈的今天,知识型企业如何科学合理的配置员工,从而降
据相关报道,汽车金融行业的整治实施方案已被国务院下发各地,各地对网贷平台的摸底排查也已全面展开。整治期间,全国范围内都将叫停金融、投资类公司注册,网贷行业的大门入口
二十一世纪的竞争已经不再局限于企业和企业之间的竞争,而转变为供应链和供应链之间的竞争。供应链从全局的角度看,它就是一个集供应商、制造商、销售商于一体的虚拟企业,它