基于多源加权融合的用户画像方法

来源 :西安工程大学 | 被引量 : 0次 | 上传用户:myselffan
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
本论文选题来源于国家重点研发计划课题“公共文化资源智能共建共享与管理平台构建与示范应用(2019YFC1521405)”。随着互联网的快速发展,用户在网络上留下了大量的行为数据,在大数据时代,用户的行为数据是一笔宝贵的财富。以此为基础,构建用户画像对于精准营销、广告投放、个性化推荐有着非常重要的意义。用户的兴趣预测是用户画像的一个热门研究方向,用户的行为数据对挖掘用户兴趣具有重要价值。对用户兴趣进行预测一般存在两个问题:(1)分析用户的单一类型行为内容数据会造成预测结果不准确;(2)分析用户的所有历史行为的内容数据会造成分析的数据量过大、分析效率较低。针对以上问题,基于用户发表、收藏、点赞、点踩、评论、浏览6类不同用户行为涉及的博客,本文进行了如下的工作研究:(1)构建了基于文本卷积神经网络(Text Convolutional Neural Networks,Text CNN)的用户画像模型。以用户发表的博客为例,通过使用Text CNN对用户发表的博客的文本内容进行分类构建单一行为数据的用户画像模型。通过基于Text CNN的用户兴趣画像模型分别对6类用户行为数据所表达的用户兴趣进行测试,筛选其中能稳定表现用户兴趣的4类数据即:发表、收藏、点赞、浏览的博客,作为后续预测用户兴趣的源数据,同时根据实验结果确定了模型的初始权值。由于用户兴趣是动态变化的,基于艾宾浩斯遗忘曲线模型和Text CNN的用户兴趣画像模型对不同时间片大小内采集的四类用户数据的兴趣预测结果的稳定性和准确率做测试,通过比较稳定性和准确率确定采集用户数据时间片。由于历史数据会影响当前的用户兴趣,基于艾宾浩斯遗忘曲线模型和Text CNN的用户兴趣画像模型对使用不同数量的时间片内的用户数据的兴趣预测结果的准确率做测试,通过比较准确率确定使用当前时间片及其前面三个时间片的用户数据来预测用户的兴趣。(2)在以上研究基础上,提出一种用于兴趣动态预测的用户行为数据采集及加权方法,该方法采集不同时间片的可以表现用户兴趣的各类数据,根据时间周期的重要程度确定不同时间片的数据的采集数量的比例,根据数据类型的重要程度确定其采集数量的比例和权值,使得预测结果更加准确。使用Text CNN对采集的不同类型的用户博客加权融合构建多源行为数据加权融合的用户兴趣画像模型。(3)对多源行为数据加权融合的用户兴趣画像模型进行优化。通过实验确定了模型数据权值,得到最优的用户行为数据采集及加权方法和画像模型。实验结果表明,使用本文提出的用户行为数据采集及加权方法,相较于使用单一行为数据预测的准确率提升了6.8%;同时动态反映兴趣预测结果的实时变化也得到了极大的改善。图15幅,表37个,参考文献52篇。
其他文献
在乡村振兴发展过程中需要正确处理与农村生态环境的关系。乡村振兴为农村生态环境带来新的发展契机,而改善农村生态环境,有助于乡村振兴发展。影响农村生态环境的主要因素是地方政府粗犷式管理,农民环境保护意识有待加强,农村缺乏环保风尚,农业生产生活方式粗放等。因此,需要抓住乡村振兴战略发展契机,各个治理主体相得益彰,形成农村生态环境综合治理势头。地方政府应与相关部门相互配合,高校与科研机构作为智力支撑,新乡
生态环境治理是乡村振兴战略下促进农村发展的关键内容,各地应当把握好政策契机,高质量地完成这项重点发展任务。随着中国经济社会的持续发展,农村生态环境问题已经成为当前阻碍中国经济社会发展的主要因素之一。在这样的大背景下,各地需要牢固树立生态保护意识,引导农村村民共同致力于维护好乡村的生态环境,同心协力地建设美好农村,共同实现美好中国梦。
背景与目的:产后抑郁症(postpartum depression,PPD)是产妇分娩后最常见的一种心理及精神障碍,有研究显示遗传、神经生化及社会-心理因素对PPD的发生有明显影响,典型症状包括情绪低落、兴趣和愉快感丧失及精力疲乏,伴随焦虑及精神病性症状等,严重者可引起自杀倾向。11%到18%的产后妇女有产后抑郁症状,且产后2-3个月内和6个月则是抑郁症发生的高峰期。目前,PPD的诊断主要在医患交
学位
2020年,上海银行业人力资源管理变革实践呈现出五大亮点:积极探索组织转型,智能招聘趋势明显,持续优化绩效管理,重视沟通机制建设,新技术应用日益广泛。面向未来,组织文化、绩效管理、奖酬激励的变革最受关注。现代市场经济的竞争主要是人才的竞争。当前,在新金融环境下,银行业人力资源管理的理念、制度、流程、运作等受到很大的冲击,行业人力资源管理的未来趋势也同样被深刻影响。面对变革挑战,有些先驱银行已
期刊
随着计算机技术的日趋成熟,我国钢铁企业的信息化建设得到快速发展。与此同时,企业积累的数据也越来越多,钢铁企业数据的爆炸式增长蕴含着巨大的商业价值。然而,在面对客户消费行为的海量数据时,传统的基于大型服务器的数据仓库和数据分析技术难以满足异构数据源数据的应用转化要求,数据的多维统计分析与展示存在严重不足。因此,运用大数据技术对钢铁企业巨量的销售数据进行分析,并依据分析结果做出正确决策,已成为当今企业
文章以世界杯足球赛为研究对象,依据宏观经济理论,构建世界杯主办国经济收支模型。运用乘数效应,以1998—2018年6次世界杯为例,研究分析主办国经济效益,发现举办大型体育赛事,导致赛事地区投资增大、消费增加以及出口增多,从而造成地区经济收入成倍增长。
自从计算机问世以来,人机交互就成了一门重要的研究课题,让用户能够操控计算机,人们更加希望计算机可以准确识别自己的指令,做出相应的操作。在实现人机交互的手势识别中,手势特征是用来分类和识别手势的重要基础。识别手势过程中,还需适应环境、手型等差异带来的影响,由于受环境与视角的影响,单一特征不能很好地完成手势的识别,虽然手势识别的准确率随着特征数的增多而提高,但选取的特征太多元化会影响识别和响应速度且复
扁挤压筒是制备宽幅薄壁板型材的最佳工具。但由于扁挤压筒自身结构的不完全对称,且在工作过程中要承受高温、高压及高摩擦,使其等效应力峰值过高、应力分布极不均匀,导致其容易开裂,影响赋役寿命。为提高扁挤压筒的使用寿命,就要降低其等效应力的峰值、提高等效应力分布的均匀性,故需要对扁挤压筒进行新结构的研发以及结构参数的优化。本文利用ANSYS APDL对两种典型吨位的扁挤压筒(5MN、80MN)分别进行静力
随着新课改的实施,阅读教学越来越受到老师和学生们的重视,但是,当前高中语文阅读教学内容和方法过于单一,只侧重培养学生应试阅读能力,忽视对学生阅读兴趣的激发和引导,这影响学生阅读领域的扩充和阅读热情的提升。此外,高中阶段的学生缺乏阅读自主性,不善于在阅读活动中进行主动的思考和探索,这不利于学生整体语文学科的学习。本文旨在探索研究适合高中阶段语文阅读教学的方法和策略,从学生的实际出发,激发学生阅读兴趣