【摘 要】
:
随着互联网信息技术的飞速发展,网络信息数据呈现出几何级别的爆炸增长态势,由此引发“信息过载”的问题。个性化的推荐系统能很好的解决这一问题。在推荐系统中,推荐算法的选择决定了推荐系统的质量。在工业级别的推荐系统中,推荐算法分为两步,分别是召回层和排序层。召回层高效快速的从数以亿计的原始物品库中选出用户感兴趣的几百个物品,排序层对挑选出的候选物品集进行精准排序以推荐给每个用户。本文主要研究召回层算法和
论文部分内容阅读
随着互联网信息技术的飞速发展,网络信息数据呈现出几何级别的爆炸增长态势,由此引发“信息过载”的问题。个性化的推荐系统能很好的解决这一问题。在推荐系统中,推荐算法的选择决定了推荐系统的质量。在工业级别的推荐系统中,推荐算法分为两步,分别是召回层和排序层。召回层高效快速的从数以亿计的原始物品库中选出用户感兴趣的几百个物品,排序层对挑选出的候选物品集进行精准排序以推荐给每个用户。本文主要研究召回层算法和排序层算法,包括如下内容:(1)在召回层提出一种基于SE-Net的双塔模型和图嵌入的双路召回算法。在双塔模型中引入SE-Net模块用以解决原双塔模型中用户塔与物品塔中特征交叉过晚的问题,通过实验验证改进后的双塔模型相比原模型召回命中率提升5%。在图嵌入召回中采用EGES算法,不同于原EGES算法中采用Deep Walk随机游走,本次实验中选取Node2Vec游走形式实现EGES图嵌入召回,最后将两种召回结果采用Light GBM模型进行融合形成双路召回。实验证明这种双路召回在实际的电商数据集中的召回效果要好于单路召回。(2)将上下文门控机制Context-Gating引入排序层的算法中,在已有的Wide&Deep模型、Deep FM模型中添加Context-Gating模块将原模型改进为CGWD、CGDFM模型,利用上下文门控机制进一步加强主体特征抑制背景特征。通过在Movie Lens-20M电影数据集上进行验证得出改进后的模型在AUC指标上分别提升了1.60%和0.94%。
其他文献
微服务软件架构具有低耦合、易扩展和高可用的优点,现代软件架构逐步向微服务演变。在高并发环境下微服务的应用带来了新的挑战:服务间的网络IO通信延时会影响服务质量;各个服务独立部署引入了分布式问题,且彼此之间相互依赖,这就需要有效的服务治理手段对集群中的各个服务节点进行管理。为了解决上述两个问题,本文设计并实现了微服务框架rush-RPC。为解决服务间的通信延时问题,rush-RPC从两方面入手:一方
税收现代化服务中国式现代化,要找到税收现代化与中国式现代化的相关性,抓住主要矛盾和矛盾的主要方面,探寻实现路径:健全税收法治体系,充分发挥税收在促进全体人民共同富裕、人与自然和谐共生中的调控作用;应用“助推理论”,优化税务执法方式;营造良好税务营商环境,优化服务,释放政策红利;强化现代税收征管,提高聚财能力;大力培育和践行中国税务精神。
在传统的运动康复中,行走训练是对下肢康复十分重要的一种训练方式。目前虚拟现实游戏中的漫游通常是通过手柄摇杆进行控制,令用户在现实空间中保持静止的同时在虚拟环境中自由漫游。这种漫游方式一方面无法令用户进行行走训练,另一方面会引起用户大脑接收到的视觉信息和前庭感官接收到的运动信息不一致从而引发晕动症。同时由于虚拟现实头显隔绝了用户与现实世界的视觉信息获取,因此如何保障用户在虚拟环境中进行训练时的安全也
由于我国人口基数庞大,地区之间经济发展水平差异明显,人均医疗资源十分有限且分布不均衡,一方面患者面临“就医难、挂号难、预约难”问题,另一方面医院存在“病源不足,资源闲置”的问题。如何在医患之间建立起有效的信息交流平台,解决患者和医院面临的问题,不仅会产生经济效益,而且会带来积极的社会效应。因此,利用软件工程技术,开发一个功能完备、服务患者和医院的网上预约挂号系统具有重要意义。网上预约挂号系统分为两
随着大数据时代的到来,如何对海量数据进行处理、分析,从而获取商业价值,已经成为了越来越多公司重点关注的问题,同时也给任务调度带来了不少挑战。首先,在大数据处理中,由于数据处理量极大,单机处理会给企业带来巨大的时间成本;其次,在单个数据处理的工作流中,可能存在工作流内部各个任务之间有上下游依赖的情况,如果仅通过传统的定时任务库如Quartz来处理,则十分麻烦,难以掌控;另外,虽然有诸如Airflow
<正>1 行业面临的问题1.1 政策与市场2020年,随着中美第一阶段贸易协定的签署,大豆供应回归正常状态。中国养殖业逐渐走出非洲猪瘟的影响,养殖存栏逐步恢复,中国大豆进口需求明显上升,同比增长13.4%。但是面对突如其来的新冠肺炎疫情,油脂油料的国内外供应链、油脂需求受到严峻考验。1.1.1 全球供应链受到新冠肺炎疫情的严峻考验新冠肺炎疫情全球蔓延致使全球经济衰退情况加剧,全球贸易保护的情况也进
随着互联网向医疗领域融合发展,在线问诊因为其方便性、安全性已成为居民的常用就医方式,因此积累了大量的在线医疗数据。命名实体识别是实现这种非结构化文本提炼的第一步。目前的医疗命名实体识别大多根据医疗书籍、电子病历等规范化文本展开研究,缺乏专门对口语化、信息间断的在线问诊记录的命名实体识别研究。本文基于Mac BERT与条件随机场模型,研究融入词信息的在线问诊记录中临床关键特征识别,并进行阴阳性判别。
近年来,随着人口老龄化的加剧和社会生存压力的增大,心血管疾病的发病率逐年上升,急性心肌梗塞的死亡率迅速上升,大量患者出现并发症。研究表明,优质护理可以有效降低心肌梗塞恢复期并发症的发生率。因此,提前预测心肌梗塞患者可能发生的并发症,以便及时实施必要的预防措施,是一项极为重要的研究。本文首先介绍了国内外学者在疾病预测领域的相关研究,尤其是机器学习算法在对各类疾病的早期预测上的应用成果。本文详细介绍了
心率是人体最重要的生理参数之一,对个体的健康状态临床评估和疾病风险管控具有重要意义。心冲击信号(Ballistocardiogram,BCG)的心率监测技术相比于传统侵入式方法(如侵入式血压)和其他非侵入式方法(如心电图、光体积变化描记图),具有易操作、易携带等优点。近年来卷积神经网络在医学影像的应用中凸显出巨大潜力,神经网络可以学习相关特征,在更复杂的端到端学习任务中重用相同的架构,这也为信号处
由于云计算、机器学习等科学技术的蓬勃发展,各类信息的数据量呈爆炸式增长。海量的数据足以支撑各类应用去做信息的推荐功能,但是目前应用的推荐准确度仍有很大的提升空间。音乐经常被当做是一种解压和娱乐的方式,一个功能简单或者推荐度不高的听歌系统很难满足用户千人千面的需求,用户粘性也不会很高。因此开发一个基于良好推荐算法的音乐系统不仅可以满足人们缓解压力的需求,还能够因人而异,准确地预测出用户的喜好并以合适