基于聚类的电子商务推荐系统研究

被引量 : 0次 | 上传用户:lanxoceco2003
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网和移动互联网的不断普及和深入发展造就了当下的大数据时代。数据量的增长在电子商务领域的体现尤为明显,这为今后的发展提供了更多契机,但也产生了信息过载这样的问题,即用户无法从海量的商品信息中快速、准确地获取到真正感兴趣的需求信息,在这一背景下推荐系统应运而生。协同过滤算法是推荐系统中应用最为广泛的技术,但是在实际应用中也存在如实时性差、准确率不高、冷启动和数据稀疏等问题。近来关于推荐系统的研究中,一些学者提出引入聚类技术来解决以上部分问题。基于聚类的推荐算法通过先对用户或者项目进行聚类划分,使得相似度较高的对象聚集到同一个类簇中,从而简化查找最近邻居的过程,大大减小了整体计算复杂度和时间消耗。另外由于聚类过程可以在线下完成,所以大大提升了推荐系统整体的实时响应性。本文对聚类技术和推荐系统做了一定理论研究,针对基于K-means的聚类推荐算法提出了4点算法改进,并通过实验验证了改进的有效性。本文主要研究内容为:(1)利用基于信息熵的权值优化传统欧氏距离的计算方式,来改进K-means算法,使之在对用户的聚类过程中能更精确的计算用户间的相似度,优化最终的聚类划分结果;利用指数函数优化粒子群算法中粒子的个体学习因子和群体学习因子取值方式,增强粒子的学习能力;利用对数变化规律优化粒子群算法中粒子速度的更新方式,提高算法的最优解搜索能力和算法收敛性。将改进的K-means和改进的PSO算法相结合,提出改进的混合聚类算法Ajusted PSO-Kmeans算法。(2)将基于信息熵的权值引入基于用户的协同过滤算法的Pearson相关系数计算方式中以改进UCF算法,使之在查找最近邻居的过程中消除用户评分向量间的量纲化差异,有利于找到兴趣偏好更相似的最近邻居。将改进的PSO-Kmeans混合聚类算法和改进的UCF算法相结合,提出了改进的基于混合聚类的推荐算法A-UCCF算法。(3)设计实现了三个实验:其一,在实验数据集Iris和Wine上验证了本文提出的Ajusted PSO-Kmeans混合聚类算法相比K-means、PSO-Kmeans算法具有更好的聚类质量和划分准确性。其二,在实验数据集MovieLens上验证了本文提出的A-UCCF算法相比UCF、UCCF算法具有更好的推荐准确性。其三,在第二个实验基础上利用查找效率指标验证了A-UCCF算法比UCF、UCCF算法具有更高的实时响应性。
其他文献
阐述了膜生物反应器的工艺特点和国内外研究状况,介绍了近几年国内外利用膜生物反应器处理轻工业废水的应用实例。在此基础上分析了膜生物反应器存在的问题,并对膜生物反应器
针对传统胶囊充填机下模块与安装轴易发生松动,造成下模块发生偏转,从而发生碰撞损坏设备的缺点,为了减少胶囊充填机故障,对胶囊充填机下模块与轴的连接结构进行改进设计,使
随着我国经济的迅速发展,人们的生活水平也在逐步的提高,人们的需求也在不断增加。与此同时,资源的消耗也在不断的加剧,人们的生活环境的污染程度也在不断的加大。面对这种情况,企
市政交通建设是城市建设的重要环节,为城市内的单位及居民提供强大的交通保障。建成城市交通网络系统,保证发挥道路作用需要加大市政道路工程施工管理。市政道路的施工质量是
MBR作为一种高效的污水处理设备受到广泛的关注。本文介绍了MBR工艺的研究现状,比较了一些MBR和其它工艺相结合污水处理技术的优缺点。最后在展望中提出MBR今后的研究重点是开
[目的]为研究碳纤维增强复合材料(CFRP)粘贴修复含裂纹加筋板的极限强度,[方法]采用非线性有限元法对在轴向压缩载荷作用下的CFRP修复含裂纹加筋板的极限强度进行分析,基于CF
众所周知建筑项目、建筑构件如果出现裂缝必然会影响建筑物、混凝土结构的使用寿命、质量问题,严重的会引发安全事故,继而给人民生命财产安全带来无以名状的损失。基于此在设
<正>一、引言伴随经济全球化,各国联系越来越紧密,西方节日对中国的影响与日俱增。许多年轻人对中国的重要传统节日不甚了解也缺乏激情,却盲目地追求庆贺西方节日。西方节日
我国政府一直都很重视港澳台学生的教育,近年来更是通过各种优惠政策吸引港澳台学生前来就读,两岸四地的教育交流日益频繁,内地高校中的港澳台学生人数持续增长。内地高校的
图形创意在平面广告中的语义传达首先要能让学生准确的掌握广告主题到图形创意的转换过程。最大限度的避免图形自身或图形创意中不相关的因素对图形中心含义的干扰,力求使图