【摘 要】
:
互联网与信息技术的高速发展,使得现在社会已进入信息过载的时代,人们在进行信息获取时越来越困难,需要付出的代价越来越高。为了解决数字信息过载的问题,推荐系统应运而生。推荐系统能够根据用户喜好主动筛选出用户可能感兴趣的信息并推荐给用户,降低了用户获取信息的难度,且能够有效提高企业的效益,因此对推荐系统的研究具有重要意义。为了能够实现推荐效果的提升,需要对系统中的推荐算法进行优化,特别是能够奠定推荐效果
论文部分内容阅读
互联网与信息技术的高速发展,使得现在社会已进入信息过载的时代,人们在进行信息获取时越来越困难,需要付出的代价越来越高。为了解决数字信息过载的问题,推荐系统应运而生。推荐系统能够根据用户喜好主动筛选出用户可能感兴趣的信息并推荐给用户,降低了用户获取信息的难度,且能够有效提高企业的效益,因此对推荐系统的研究具有重要意义。为了能够实现推荐效果的提升,需要对系统中的推荐算法进行优化,特别是能够奠定推荐效果的离线推荐。本文拟基于用户评论数据,探讨离线推荐算法的优化问题。本文的主要工作内容如下:(1)针对离线推荐中召回阶段,提出一种基于内容感知的协同过滤召回模型。该模型采用Autoencoder作为基本框架,通过进行用户评论数据中评分数据矩阵的重建实现了物品召回候选集的筛选。模型在进行评分重建时,首先将物品评分经过Encoder获取物品的抽象表示,接着与用户评论文本描述的序列和非序列信息进行融合,再将其与相邻物品集的特征表示通过Decoder获取重建的评分数据,最后利用Amazon公开数据集与酒店数据集进行对比实验,验证了该模型的有效性。(2)针对离线推荐中排序阶段,提出一种基于Deep FM优化的排序模型。该模型将对物品排序问题转化为CTR(Click-Through-Rate)预测问题。其将能够同时进行高阶与低阶特征组合的Deep FM作为基线模型,并引入多头注意力机制和用户喜好特征表示,以有效地表示用户和体现用户兴趣的多样性。在Amazon和Movie Lens公开数据集上进行了对比实验,验证了该排序模型的有效性。(3)实现了基于酒店数据的推荐服务。将所提出模型进行整合,再通过使用Flask框架实现了模型的RESTful API服务,并以酒店数据集作为系统数据给出了酒店推荐服务的可视化展示。
其他文献
收费站是提升高速公路系统通行效率的关键位置。电子不停车收费(Electronic Toll Collection,ETC)是提升收费站通行能力的有效措施,经过长时间的发展,ETC用户比例在不断增加,2019年出台的多项政策进一步加快了ETC全面普及的进程。ETC用户的快速增加使得ETC车道异常事件的不利影响逐渐凸显,因此本文旨在量化异常事件对收费站通行效率的影响,进而合理优化车道配置,降低社会效益
本文讨论了不依赖于时间的Navier-Stokes方程最优控制问题的数值解法,通过Q2-Q1混合有限元离散,将此类控制问题转化为一个大型稀疏的非对称鞍点问题。为有效求解此类病态的鞍
格奥尔格·毕希纳(Georg Büchner,1813-1837)是德国19世纪重要的现实主义作家、戏剧家,德国现代文学的先行者。在短暂的24岁生命中,毕希纳一共创作出四部文学作品,它们都在德国文学史上产生了重要的影响。其中,《沃伊采克》是毕希纳的未竟之作,是他留下的几个不同版本的手稿断片。这部戏剧是毕希纳根据社会真实事件改编而成,讲述了身处社会底层的士兵沃伊采克的悲剧命运。毕希纳在这部作品中探讨
社区公共空间作为城市居民日常生活的重要载体,在公共空间产生的活动与提供的多样功能常常被视作是真实城市居民生活的映射。然而随着城市的快速发展,城市社区人口密度的快速扩增,长期以来,城市社区公共空间的建设采用的模式化、套路化的设计方式,已无法满足当前居民的生活方式与精神需求,同时产生了基于年龄差异的公共空间的空间占据、时间使用时长等不公平现象,最终产生社区居民间矛盾。针对上述问题,论文以城市社区公共空
20世纪90年代以来,伴随着中国经济体制转轨和社会结构转型的加速,城市在剧烈变迁中出现了一系列新问题。社会阶层分化,贫富差距扩大,贫困群体作为城市弱势群体逐渐边缘化、集中化。成都市作为近年来发展最为迅速的城市之一,阶层分化、收入差距等问题日益凸显,旧城区、城中村和城市边缘区等典型的贫困聚居区都有出现。从发达国家治理路程来看,成都市正处于集中拆建贫困聚居区的第一阶段。解决城市贫困人口的集中化、边缘化
当今社会已经迈入了万物互联时代,大量终端的存在为这个社会产生了大量的信息与数据。在信息收集之初,大家并不完全清楚最终想要的是哪些数据,大而全地收集数据成为了一个较为稳妥地选择方案,也因此造成了最终的数据中包含了大量无用甚至垃圾的数据。数据的质量会对学习模型的性能产生重要的影响已经是行业内的一个普遍共识。大规模的数据也会提高模型的学习时间,降低学习效率。因此,对原始数据进行特征选择已经成为机器学习领
新一代Caa S云服务模式的形成,为用户提供了快速构建具有敏捷性的生产环境,加快了产品的研发和发布周期。以Docker为代表的容器虚拟化技术凭借其轻量级、易移植、快启动等优点迅速在工业界得到应用,随之用于管理部署大规模集群容器的Kubernetes凭借其强大的管理功能、较好的兼容性以及开源等特点成为业界主流的容器编排系统。然而当前Kubernetes最核心的调度功能仅包含较为单一的调度策略,难以适
随着互联网技术的更新、算法和大数据的发展以及网络应用的传播与普及,我们进入到一个“万物皆媒”的时代,依靠网络技术和大数据平台为基础的内容聚合平台兴起,聚合型视频平台、音乐平台以及新闻搜索类平台广泛出现于大众视野中,不可避免的会引发新旧媒体间的冲突。新媒体时代的到来一方面给网络信息的发展带来了极大的便利,同时也给人们的生活带来了天翻地覆的改变,然而从另一方面来看,新媒体的兴起与广泛适用也引发了较为严
无缝线路是现代铁路的主要组成部分,而钢轨焊接是无缝线路建设中的关键环节。闪光焊由于其具有自动化程度高、接头质量好、焊接速度快及焊接质量稳定等优点,已成为钢轨焊接最主要的方法之一。钢轨闪光焊焊接接头质量主要取决于合理的温度场分布、钢轨顶锻前端面的状态以及与温度场匹配的顶锻过程。其中,温度场分布和钢轨顶锻前端面的状态可以通过改变闪光工艺进行调整。由于闪光焊的特殊性,没有外加保护气体,仅靠在闪光过程中高
随着移动互联网的发展,社交网络已经成为人们生活中重要的一部分。在社交网络中,人们不仅仅是信息的接收者也是内容的创造者。诸如微博、推特等平台大大加速了人与人之间信息交流的速度和深度。目前,社交网络已经成为了人们获取信息的最重要的渠道。在这样的便利环境下,社交网络也降低了不实信息的传播成本。与传统的文本信息相比,带有图像的信息不仅能提供更加丰富的情节来吸引更多的读者,而且能够增加信息的可信度,然而这常