基于文本挖掘与排序学习的内容推荐系统设计与实现

来源 :北京交通大学 | 被引量 : 2次 | 上传用户:zidapp
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术尤其是移动互联网技术的飞速发展,网络平台上的信息量呈现指数级增长,如何从海量数据中发现感兴趣的内容对用户来说是一大挑战。作为应对这种挑战的有效手段,推荐系统被越来越多地用于为用户提供个性化服务。然而文本主题多元化和用户兴趣变化的时序性,使得传统的推荐策略很难满足用户的个性化需要。如何深层挖掘文本信息、结合机器学习算法召回推荐商品并精准排序成为本系统研究的重点。针对上述问题,本文设计了一种基于文本挖掘与排序学习的推荐系统,研究了新型推荐方案,包括文本建模算法、候选集召回算法及候选集排序算法,然后基于该推荐策略设计并实现了内容推荐系统。主要工作内容如下:(1)结合文本主题概率模型和深度神经网络,提出了一种推荐候选集触发策略。该策略使用深度神经网络挖掘用户与商品的深层属性,使用梯度下降与反向传播对模型进行训练,计算用户与商品在相同空间下的特征序列,通过近邻计算找到与用户喜好最相关的商品集合。尝试性的利用隐含狄利克雷分布计算文本主题分布,嵌入到用户阅读历史兴趣序列作为模型的预训练数据,不仅提高了深度神经网络模型计算的准确率,也使模型损失函数快速收敛,提高了计算效率。(2)结合深度神经网络与因子分解机构建了融合模型,该模型通过构造用户与商品的低阶特征组合和高阶特征组合,挖掘用户与商品复杂的隐含联系,实现了对推荐商品的点击率预测,从而在客户端展示数量有限的情况下,对召回推荐列表精准筛选与排序。线上A/B测试表明,该算法使得用户的点击率比原有基于标签的推荐提高了 14%。(3)结合用户和系统需求,设计了内容推荐系统的整体架构,并基于Spring Boot框架设计实现了推荐系统的在线服务,能够有效处理用户请求,将推荐算法与复杂业务逻辑筛选出的推荐商品列表及时返回给客户端,并验证了系统的功能与性能。目前该系统已成功运用于得到APP大规模文章推荐,很大程度上改善了用户体验。图40幅,表16个,参考文献42篇。
其他文献
<正>规范农商银行股权管理的关键在于优化股权结构,要害在于强化股东资质监管。同时,建立健全股权流转机制,加强内部监督,有效推动股东股权整改,也是必经之途《商业银行公司
采用单向琼脂免疫扩散法,测定Zmu-1:DHP品系豚鼠的血清IgG含量。从15~70日龄起,血清IgG水平逐渐递增,70日龄后趋于平稳或稍有下降。血清含量的变异系数随日龄增加而递减。该品系豚鼠常用日龄(35d)或体重(300g)的血
针对高职院校《机械设计基础》课程传统教学方法的弊端,文章分析了课程内容与知识特点,提出基于三维软件应用的课程项目化教学设计与课程资源开发模式,对机械类专业基础课程
针对电气设备自动控制技术进行介绍,并且结合实际电气设备自动控制设计案例,分析自动控制设计方案的制定发展趋势,旨在提升电子设备自动化控制水平。
伴随着城市化进程的加快,有关于城市建设的思考也变得越来越深入,其中着重思考和探究的一个问题是怎样保持和提升城市发展的可持续性,怎样在实际发展当中巩固和强化地域特色
采用三轴仪对PVC纤维土在固结不排水的条件下,进行常规三轴压缩试验,探讨在不同长度或掺量组合下该纤维土的应力-应变关系,分析影响纤维土应力-应变关系及其抗剪强度的因素.
随着近些年来新课程标准的不断改革,教育体制和教学理念也在不断改进和完善.就目前而言,职业中专教育仍然是我国经济发展的重要基础,也是我们在人才培养、教学方法、教学内容
人类已经进入人工智能时代,随着技术的日渐成熟,越来越多的人工智能开始应用到人类生产生活的方方面面。在作品创作领域,人工智能就发展得尤为迅速,其创作的成果已经可以达到以假乱真的程度。但是当前法律界对相关问题的理论研究分歧较大,主要集中于对人工智能创作物的性质认定以及保护路径选择方面。学术观点众多,学派林立,不同观点之间争议较大,目前还未形成一个相对统一的结论。但各学术观点讨论的前提均是强人工智能阶段
随着科学技术的不断发展,自动控制技术作为一种较为先进的技术在社会各行各业等到广泛应用。电气设备是人们日常生活工作的必不可少的基础设施,电气行业的快速发展可以加快我
新时期下,我国更加重视企业的税收问题,为了适应经济市场的实际需求,国家税收政策也不断调整。税费的支出一直在企业成本中占比很大,企业要想合理合法地减少税费的支出就必须