一种分布式推荐召回引擎的设计与实现

来源 :南京大学 | 被引量 : 0次 | 上传用户:luomlkm
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术和互联网的发展,互联网中的海量数据造成了严重的信息过载。为了解决信息过载问题,推荐系统应运而生,推荐系统的目的是根据用户意图引导用户发现他们感兴趣的产品或信息。目前,网易考拉的推荐系统架构已经无法应对数百万级别的商品数量增长,要从几百万商品中找到用户感兴趣的商品需要耗费很多时间。随着商品数量的增长,商品信息更新会越来越频繁。信息更新耗费大量系统资源,导致服务发生抖动的频率也越来越高。同时,随着业务的扩张,适用于推荐系统的业务场景也越来越多,开发人员对于每个场景都需要重新编写一套代码以满足业务需求,大量重复代码会降低开发效率。本文总结了推荐系统的相关概念和核心技术,分析了网易考拉推荐系统的业务需求,提出了一种全新的分布式召回引擎解决方案。本文设计的分布式系统包含四大核心模块,分别是分布式并行模块、召回过滤模块、场景配置模块和数据更新模块,使用主流技术解决了多场景推荐、大规模信息更新和服务稳定性问题。系统使用Dubbo和Akka构建了分布式并行模块,分布式模块使用集群解决了海量商品数据的存储和更新问题,提升了服务的稳定性和处理速度。同时,系统在召回过滤模块中使用了 Redis和Ehcache作为缓存中间件,进一步提升了业务流程的执行速度。在场景配置模块中,系统使用配置文件来管理所有业务场景,解决了多场景推荐的问题。在数据更新模块中,系统使用文件更新和Kafka更新两种方式保证了数据的实时性和有效性。目前,系统经过功能测试和性能测试后,在线上运行良好。集群内单台机器每秒能处理2000次请求,推荐系统的接口耗时和垃圾回收时间相比使用本系统前均减小了 50%。本系统能满足存在的几十种业务场景以及日后可能存在的扩展需求,并且随着商品数量的持续增长,系统能提供一套稳定的召回过滤服务。
其他文献
microRNAs(miRNAs)是一类长约19-23 nt的单链非编码小RNA。动物miRNAs在不同生理病理状态下呈现不同表达状态,导致其靶基因的异常扩增或表达抑制,从而参与疾病的发生发展,在癌症中也是如此。已经有大量研究表明,在癌症发生过程中,许多重要的促癌或抑癌基因都受到miRNAs的调控,研究癌症重要基因的miRNA调控通路,揭示该基因的异常表达的调节机制,可以进一步解释癌症发生发展的分
青州龙兴寺窖藏佛像一直是学术界的重要关注点,这批造像不仅数量众多、雕凿精美,而且展现出与同期其他造像不同的独特风格。有关这些风格,目前学界已有较多研究,但风格背后的来源,和给予当代中国佛教类题材绘画的启示,却鲜有提及。本文在充分掌握已有研究的基础上,将“青州风格”与同期著名画家曹仲达的绘画风格相比较,发现两者背后的来源与发展有着一致性:均受到印度笈多风格影响,并在南朝产生演变。曹仲达为代表的“曹衣
学位
学位
近些年来,随着互联网科技的快速发展,推进法院信息化的建设工作也被纳入战略部署。伴随着数据以指数级别的速度累积增长,以及大数据技术的日渐成熟,基于司法大数据的一系列研究都相继展开。裁判文书是诉讼活动结果的载体,记载着人民法院审理过程和结果,也是开展法院大数据研究工作的重要基础。在人工智能的研究背景下,任何实验的研究与验证都离不开大量有效文书数据的支持。对此,通过裁判文书检索与推荐系统筛选出相关性文书
酶是催化生物化学反应的重要生物大分子机器,主要以蛋白质分子构成。在酶的催化作用下,细胞内本来发生很慢的化学反应能够在生物学相关时间尺度内完成,从而在调控生物过程和实现生物功能中起了至关重要的作用。催化效率是表征酶催化能力的重要属性。酶的催化效率不仅依赖于所催化的化学反应步骤,而且依赖于酶分子的构象转变以及底物-产物结合-解离等物理过程。自然界的酶通常具有很高的催化效率。因此,研究自然界酶如何整合酶
由于氮元素是多种药物分子、天然产物、有机材料的重要组成部分,如何高效构筑有机含氮化合物一直是有机化学的研究热点。最常见的碳氮键构建方法是亲电性的碳源和常见的亲核性胺化试剂间的偶联反应。有机叠氮化合物则是一类独特的亲电性胺化试剂,它具有易于制备、原子经济性高等优势。本文围绕着有机叠氮化合物为亲电性氮源的胺化反应展开,内容可分为两部分:一、可见光诱导的分子内碳氢键胺化反应;二、铜和4-二甲氨基吡啶(D
科学推理是认知发展到形式运算阶段时儿童或成人所能够获得的推理能力,处在形式运算阶段的儿童思维不再依赖于具体的可感知的事物,可通过假设推理来解答问题,并且具有了一定的假设推理的能力,其直接影响着学生日常独立思考、学习和解决问题的能力。为认识和进一步帮助提高高中生的科学推理能力,本文使用Lawson教授设计用来专门测量科学推理能力的调查问卷,对两所不同类型学校的高中学生进行了测试,并利用工具SPSS
[目的]定量研究卢戈氏碘液(I2KI)染色增强应用于Micro-CT软组织精确成像的最佳浓度和时间,以及I2KI染色对组织收缩率和后续HE切片质量的影响,以期为临床肿瘤成像研究探索新方法。[方法](1)新西兰大白兔舌体组织12个(体积:0.386±0.028mm3),随机分为4组,置于10%中性福尔马林溶液(10%neutral buffered formalin,10%NBF)中充分固定12h,
聚糖是细胞的基本组成成分之一,是自然界中最丰富、最多样化的生物高分子,是调节细胞识别、细胞通讯、细胞粘附和免疫反应的关键。糖基化是一类非模板驱动的生物合成过程,其进程取决于细胞类型。异常糖基化与疾病(如癌症)的进程息息相关。因此,针对特定类型的细胞进行聚糖重构对于充分理解和精确调节聚糖功能具有重要意义,可以为组织特异性聚糖成像和肿瘤免疫治疗提供有力的工具。现有的细胞特异性聚糖重构方法主要有两类:间