【摘 要】
:
随着信息技术的发展,互联网为人们的日常生活带来了诸多便利,人们可以通过互联网随时随地的浏览、获取信息。互联网为我们带来便利的同时,也带来了海量的数据信息。面对海量的数据信息,用户无法快速准确的定位感兴趣的信息,造成了数据冗余问题。本论文基于此背景,设计并实现了一款基于Spark的商户推荐系统,帮助用户过滤出感兴趣的商户信息,解决海量商户数据造成的数据冗余问题。系统整体采用模型/视图/控制器(MVC
论文部分内容阅读
随着信息技术的发展,互联网为人们的日常生活带来了诸多便利,人们可以通过互联网随时随地的浏览、获取信息。互联网为我们带来便利的同时,也带来了海量的数据信息。面对海量的数据信息,用户无法快速准确的定位感兴趣的信息,造成了数据冗余问题。本论文基于此背景,设计并实现了一款基于Spark的商户推荐系统,帮助用户过滤出感兴趣的商户信息,解决海量商户数据造成的数据冗余问题。系统整体采用模型/视图/控制器(MVC)三层架构设计模式,开发框架选择Spring Boot完成Web应用的开发。Spring Boot内部集成的Spring MVC框架进行前后端的控制转发,My Batis同主业务数据库做映射,保存、读取推荐结果,推荐结果最终通过前端页面呈现给系统用户。系统的核心是推荐功能,推荐功能采用Spark分布式计算框架进行开发实现。系统内设计实现了离线、实时两个推荐功能。离线推荐功能内包括:基于内容的离线推荐、基于隐语义模型的离线推荐、基于统计的热门内容推荐三个模块。基于内容的离线推荐模块,通过计算标签信息的权重值,构建用户、物品画像进行推荐,因为系统内物品信息较于用户信息更加的稳定,基于内容的推荐模块十分适用于系统的冷启动期。基于隐语义模型的离线推荐模块结合用户行为矩阵进行评分预测。区别于单纯的基于内容推荐,这一模块利用评分信息,能够侧面的反应物品的质量优劣,推荐结果优于基于内容的离线推荐模块。基于统计的热门内容离线推荐模块配置Mongo DB连接信息,连接主业务数据库,获取数据库中数据信息。这一模块基于数量统计直接查询数据库内数据得到推荐结果,得到的推荐结果同用户的历史行为数据重叠度低,能够挖掘更多的用户信息,丰富用户画像。实时推荐功能内包括基于近k次评分的实时推荐、基于内容的实时推荐两个模块。基于近k次评分的实时推荐模块内,实现了一种结合评分和相似度的推荐优先级计算算法,该模块直接利用基于隐语义模型离线推荐模块产出的相似度信息进行计算,大大的节省了运行时间。基于内容的实时推荐模块获取基于内容的离线推荐模块中产出的相似度信息进行推荐,满足实时场景下的基于内容推荐。离线、实时两个推荐功能基于混合推荐的机制进行联动,可以应用于不同的推荐场景。系统目前已经通过了各项测试指标,能够在稳定运行的基础上,满足用户不同场景下的使用需求。
其他文献
随着中国城镇化进程的不断发展以及城市居民住房需求的日益增长,出现了“夹心层”住房难的问题,因此,针对中低收入群体出租的保障性住房应时而生。但因公租房建设量大、资金回流慢等原因,建设需要大量资金支持,仅仅依靠国家财政难以维持。为解决公租房建设资金短缺的难题,有关部门学习国外保障性住房建设运营实践经验,将PPP模式引入公租房建设和运营中,不仅为公租房建设带来新的融资渠道、减轻政府的资金压力,同时为民间
高地应力问题是目前隧道及地下工程研究工作者们的研究难点及热点问题。尤其对于软岩隧道,因高地应力引起的围岩变形量大、变形速率高、变形持续时间长等特点,给设计和施工带来极大的困难。同时由于原岩地应力的分布存在着诸多随机与不确定因素,导致建立在原岩地应力场基础上的隧道围岩与支护结构应力、以及洞周变形的分析也存在着诸多不确定性。本文基于原岩地应力及地层参数的随机性以及变异性特征对地应力不确定性分析,并基于
机器人技术的深入发展使得机器人应用的触角深入生活方方面面,特别是在医疗业和物流业,机器人已成为助推产业变革的重要力量,人机协作的安全性与柔顺性成为亟待解决的问题。本文基于人体上肢柔顺原理,设计了肘关节刚度可变的两自由度机械臂,使用表面机电信号作为人体肘关节刚度信息载体,提出人机刚度匹配控制方法,提高了人机交互时的柔顺性。论文完成的主要工作如下:首先,基于人体上肢生物学参数,完成了SoftJoint
毫米波高增益低副瓣天线是点对点无线接入、高速回传等毫米波通信系统的核心器件。本文针对当前毫米波反射面天线体积大、剖面高和基片集成阵列天线馈电网络传输损耗较大的问题,研究设计了具有基片集成和金属三维打印混合馈电网络结构的毫米波低副瓣磁电偶极子天线阵列。该天线阵列结合了基片集成馈电网络功率分配调控灵活和空气填充波导馈电网络低损耗的优势,实现了毫米波平面阵列的高增益低副瓣辐射。本文的主要工作和创新总结如
无机非金属材料在人们日常生活以及高新技术发展中扮演了至关重要的角色,本文针对无机非金属材料在非线性光学以及第三代半导体材料中的应用进行探究,通过不同技术制备了掺杂铌酸锂晶体以及氮化铝薄膜,并对其结构与性能进行表征。铌酸锂作为一种非线性光学晶体,具有透过范围广、非线性系数高、易于生长大尺寸晶体等特点,是准参量啁啾脉冲放大(QPCPA)系统中理想的频率转换晶体。QPCPA系统中,通过对闲频光的吸收,可
无人机监控具有效率高、成本低、范围广、机动性好等优点,可以克服固定监控摄像头的缺点。将视觉技术与无人机平台融合,不仅能提升无人机监控的智能化水平,还能拓展无人机平台的多元化应用。无人机监控图像由于其飞行高度和复杂环境背景,使得一些通用目标检测算法效果较差。为此,针对无人机拍摄目标尺度和宽高比变化大、类别不均衡,以及弱小密集目标识别精度差等问题,论文进行了深入研究。主要内容如下:(1)针对无人机拍摄
驾驶模拟实验数据的处理分析有利于交通工程领域实验员对驾驶员行为进行深入研究。然而,现有的驾驶模拟实验数据庞大且实验流程繁杂,课题因人而异但基本数据处理方式和分析方法大致相同。为方便后续分析,交通领域学者往往需要学习不同的编程语言对原始模拟数据进行分段和提取,这无疑增添了重复的研究步骤;并且大量基于时间点的数据并不直观,人工寻找有效关键区域耗时耗力。因此,本论文从软件工程学出发,结合驾驶模拟实验和数
近年来,大气压等离子体射流所生成的低温等离子体在多方面展现出极为广阔的应用前景。但目前大部分射流是在惰性气体或者气流作用的条件下产生的,而大气压空气辉光低温等离子体射流的形成和发展机理研究较少。本论文通过对放电理论的分析和公式的推导、以及电场仿真和实验测量等手段,探究了在大气压空气条件下形成辉光等离子体射流的必要条件、基于大限流电阻条件下针-板电极放电的发展过程和生成特性以及介质管对带电粒子运动的
随着列车运营速度提升以及强量化要求的提出,高速列车车内乘坐舒适性受到更多的关注。为满足高速列车400km/h运行速度下车内噪声指标,本文以某型高速列车为研究对象,重点对列车头车区域噪声环境进行分析,利用混合有限元-统计能量分析方法建立高速列车头车仿真模型,加载激励计算得到400km/h速度条件下车内声学参数,从而评价车内噪声状况,并对照车内噪声指标进行优化设计,为400km/h高速列车设计提供技术
高端轴承性能不仅取决于材料的化学成分,也取决于热处理技术的研发与应用。目前国内对G20Cr Ni2Mo A渗碳钢轴承套圈的渗碳热处理工艺已经开展了一定的研究工作,但对标准中关键控制指标的确定尚欠缺科学理解。本文以动车组轴箱轴承套圈为研究对象,通过试验、仿真分析、对比等方法,研究并确立了渗碳轴承钢的热处理关键控制指标参数的控制规范,并基于此开展了热处理工艺仿真优化研究。论文的主要研究内容如下:首先,