基于社交行为的用户品牌偏好挖掘算法研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:HIT_Happy
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的到来促进了信息的爆炸性增长,人们从海量信息中定位自己感兴趣的信息变得越来越困难,“信息过载”现象严重。个性化推荐技术通过挖掘海量数据获取用户的偏好,并根据用户的偏好为其推荐相应的内容,有效解决信息过载问题。然而,个性化推荐技术仍然面临着数据稀疏性、用户冷启动等挑战。社交网站为挖掘用户兴趣提供了额外的信息来源,不少研究通过跨域引入用户社交信息的方式解决传统个性化推荐面临的相关问题。然而,大多数研究只考虑了引入用户的个人信息和社交关系信息,却很少考虑到引入同样包含用户兴趣的社交行为信息。同时,跨域引入社交行为信息存在三个方面的挑战:1)社交域和电商域的数据通常来自不同的网站,需要找到领域间的重叠用户,并通过这些用户对齐不同领域的信息。2)不同领域数据的形式不同,从不同领域构建的特征既要能够输入到同一推荐模型中,也要保证原有数据中的信息完整性。3)社交行为和购物行为发生的时间是不同步的,引入时序信息时行为不同步会对挖掘用户时序兴趣产生一定的干扰。为了应对这些挑战,本文提出了一种跨域时序偏好挖掘算法,有效引入时序社交行为信息,缓解用户冷启动、用户兴趣变化等问题,主要贡献如下:1、提出了一种跨域时序偏好挖掘算法。首先改进矩阵分解技术提出了跨域偏好预测模型,构建社交行为特征与商品购买偏好之间的跨域映射关系。然后从时间维度上假设用户在不同时间段的兴趣不同,根据社交、购物行为发生的时间将这些行为划分到不同的时间段内并构建相应的时序特征。最后提出跨域时序偏好预测模型,从用户的时序社交行为中挖掘用户的时序购买偏好,推荐用户感兴趣的商品,解决用户冷启动、用户兴趣变化等问题。2、通过微博开源API获取用户的微博数据,从国内大型电商平台获取用户的购买数据,通过重叠用户连接不同领域的数据构造真实环境下的跨域数据集。然后在该数据集上进行了实验,验证所提出的模型的有效性。3、基于上述提出的跨域时序偏好挖掘算法,进一步提出了一个用于线上环境的基于跨域偏好挖掘的潜在客户挖掘与推荐系统构建方案。该系统方案能够根据用户的社交信息有效解决通过社交账号登录的新用户的偏好预测与推荐问题,同时根据用户社交信息的变化及时更新预测结果,为系统的精准推荐提供保障。本研究验证了所提出的跨域引入用户社交文本行为能够有效提升推荐效果的假设,同时也验证了所提出的跨域时序偏好挖掘算法能够较好的解决用户冷启动、用户兴趣变化等问题,有效提高推荐系统的推荐质量。
其他文献
PSD-95是新近在谷氨酸能突触的突触后致密物(PSD)中发现的一种特殊蛋白质,含有3个N末端的PDZ结构域、一个SH3结构域和一个C末端的GK结构域.PSD-95通过不同结构域与其它蛋白相
目的对广东省各地市CT、PET—CT机配置现状及平衡性进行分析,为卫生行政部门优化卫生资源配置提供科学依据。方法通过实地调查、问卷调查、文献调查(咨询卫生管理部门)等方法收
据海关最新统计,我国出口企业已累计1500亿美元的海外商账难以追回,并以每年10%的速度递增。事实说明,外贸企业面临着来自诸多方面的风险,且与日剧增。风险的不确定性严重伤害了企
目的观察有机磷农药中毒患者应用盐酸戊乙奎醚治疗的疗效及心肌酶谱指标变化情况。方法选择2016年3月至2018年3月我院收治的60例有机磷农药中毒患者,采用随机数表法分为2组,
本文通过简要介绍指纹识别技术来展望其广阔应用前景,并介绍了其一具体应用实例.
为研究不同锰源与锰水平对肉仔鸡的生产性能与组织矿物元素沉积的影响,试验采用2×5完全随机试验设计,在玉米—豆粕型基础日粮(锰含量为37.66mg/kg)中添加0、45、90、130
冬季对果园进行灌水可增加土壤含水量,提高果树抗寒能力,加快土壤有机质的分解,提高土壤肥力。①冬灌时间:果实采收后至土壤封冻前均可进行冬灌.但以5厘米土层内平均地温降
期刊
目的了解近年来上海市松江区乙型病毒性肝炎(简称乙肝)报告发病及血清感染免疫现状,评价控制效果,为进一步采取措施提供参考依据。方法采用描述流行病学对2006-2015年上海市
火焰筒作为燃气轮机的核心零部件,关系到燃气轮机的热耗、性能以及排放等众多指标,为了提升火焰筒生产线的产量,缩短产品的生产周期,提高产品的质量,同时验证工艺路线的合理
在信息化高度发展的今天,对传统的公共卫生数据传输机制和管理方式进行信息化改革,成为当前农村地区公共卫生建设的当务之急。本文通过调查分析,设计了基于GIS的农村公共卫生