面向O2O显隐式反馈的分布式混合推荐方法研究

来源 :武汉理工大学 | 被引量 : 0次 | 上传用户:a522599301
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着线上线下交易的越发频繁,O2O行业正在以前所未有的速度发展,同时也带来了海量蕴藏着巨大商机的数据。这些数据经过有效处理,可以提取大量用户及产品的相互关联信息,为用户提供精准推荐。但经研究发现,O2O数据因其体量大、类型多、速率快、密度低、隐式数据样本不均衡等特点,在推荐上存在许多问题。为此,本文提出了一种对O2O显式和隐式反馈数据进行混合推荐的大数据推荐系统方案,并设计了相应的分布式算法。方案首先通过设计一套融合聚类和基于用户协同过滤思想的推荐算法,来处理O2O显式数据,并通过建立冷启动仓库、矩阵分解预处理、训练聚类模型、优化聚类,改善了数据稀疏、冷启动问题,缩小了协同过滤相邻用户计算范围,提高了整体效率。然后,本文通过对隐式反馈数据基于选择倾向度的推荐,与显式数据结果作混合,并设计了一种全新的变加权混合策略,形成了更为精准的推荐结果。本文主要工作有以下三个方面:1)针对协同过滤推荐效率和精度问题,将基于模型的聚类分析融入基于用户的协同过滤推荐算法中,并利用Canopy粗聚类的思想改进了聚类过程本身,使得聚类模型更稳定,以此更准确地缩小了协同过滤算法邻居用户的计算范围,提高了算法整体效率,增强了推荐方案的实时性。并最终将算法实现并行化;2)针对O2O数据在推荐中的数据稀疏问题,对新用户和稀疏数据建立了预处理机制,对新用户建立了冷启动仓库策略,通过计算冷启动影响因子,融入信息熵和流行度共同影响排序,对新用户冷启动问题进行了TOP-N推荐;并利用ALS矩阵分解改善了O2O数据原本的稀疏问题;3)提出了一种全新的显隐式变加权混合策略,引入隐式反馈数据和显式数据作混合推荐,使得权值混合推荐更个性化,针对性更强。通过设立公共权值进行初步推荐,设立用户个性权值,让显式和隐式数据权重交由用户自控并可视化权值对推荐的改进,反馈个性权值改进公共权值,形成了一种权值可变的自学习个性化混合推荐策略。本文最后针对方案进行了测试与评估,在数据超过十万以上规模的情况下,平均绝对误差MAE相较传统算法降低近7.5%,平均正确率均值MAP较SPCF和分布式UserCF分别提升近4.64%和3.27%。平均百分比排序MPR进行测试,达11.7%。本文研究对推荐性能的提升得到了验证。
其他文献
如今,伴随着工业化的快速发展和科学技术的日益提高,人们对于地球资源的消耗与日俱增。与其同时,各种各样的环境问题也相继浮现。工业生产和日常生活中产生的各种易爆、易燃
本论文首先简要介绍了固态材料表面润湿特性方面的相关基本理论及模型,综述了介电润湿的发展史、研究现状以及目前面临的主要挑战和待改善的问题。基于选用高介电材料来改善
混合交通是我国城市交通流的主要特点,汽车和摩托车、电动轻便摩托车、电动自行车以及自行车之间的相互干扰使得城市道路的拥堵日渐严重,严重影响了交通的顺畅运行。城市路段是
在国家提倡素质教育,大力发展美育的教学思想趋势下,民间美术教育作为一个多元化的教学体系,它的学科不仅跨度大而且操作性强,是一门值得深入研究的课题。其中以中小学阶段的
水乃万物之源,孕育着万物,同样人类的一切生命活动都离不开水。众所周知,喀斯特地区降雨量并不少,但是基于喀斯特地质结构特点,能够存留并且使用的并不多,因此研究喀斯特地区
如今,科学技术高度发达,传感器技术作为信息技术的重要支撑,在科学实验和工业生产实践中起着巨大作用,因此,已有众多学者逐渐投入到传感器的研究中。制作传感器之前,通常要用
巨灾风险管理机制是指在政府的主导下,在全面、动态、系统分析的基础上,将社会各界力量与分散的资金有效协同地汇集起来,共同应对巨灾风险,实现风险管理手段优化组合的整合性
随着可视化技术的逐步发展,医生将医学图像作为病人疾病诊断的重要直观依据,并通过越来越丰富清晰的图像信息来确诊病人的病情以及确定相应的治疗方案。医学图像配准是医学图
改革开放以来,随着经济环境的日益改善,全球一体化程度的加深,我国经济发展取得了巨大成就。其中东部地区经济发展表现尤为突出,究其原因,除东部地区良好的基础设施、政府的
我国女子网球选手在近几年参加的一些网球硬地赛事中取得了不错的成绩,但与世界顶尖球员相比,还存在一些差距。本文运用了录像观察法、文献资料法和数理统计等分析方法,以8位