基于Spark的电影推荐系统设计与实现

来源 :北京邮电大学 | 被引量 : 7次 | 上传用户:taotaolovely
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网技术的迅速发展带来了一个信息爆炸的时代,我们每天接触到的信息以指数的形式在增长,这就导致了信息过载的出现。信息过载一方面使用户很难发现自己真正喜欢的部分,另一方面,网络中大量信息成为“暗信息”,无法被用户发现。目前,信息过载最好的解决方案就是推荐系统。推荐系统通过建立用户和物品的二元关系,利用用户的历史记录发现潜在偏好,进而产生。但是不同的推荐算法都有自己的不足,因此混合推荐成为了一个热点研究方向。本文首先对常用的推荐算法进行了分析,并总结了算法的优缺点。基于不同的混合策略,文中提出了两种不同的混合推荐系统的设计方案-切换式和特征补充式,研究了混合策略对推荐性能的影响。实验证明,混合策略可以在一定程度上改善系统的推荐性能。为了提升系统对海量数据的处理能力,本文基于Spark平台,利用特征补充式混合推荐方案,设计并实现了一个电影推荐系统。最后,利用本文的实验数据集对系统进行了测试。
其他文献
根据2014年8月在厦门黄厝和十八线潮下带海区,以及2014年1月-6月在厦门玩月坡潮间带获得的文昌鱼及其他大型底栖动物数据,对厦门海域文昌鱼及其他大型底栖动物资源现状进行了
针对沉箱出运时半潜驳平潜作业稳性不满足规范要求和下潜深度存在不足的问题进行了分析,提出了利用半潜驳艏倾下潜加起重船吊扶来弥补的措施。沉箱出运结果表明,这种方法是切
采用带六极杆碰撞池技术(CCT)的电感耦合等离子体质谱(ICP-MS)测定了海洋沉积物中的钒和铬。在六极杆碰撞池中引入He/NH3(99/1)混合气,有效地减轻了多原子离子(ClO+,ClN+,ClO
针对全寿命周期成本中故障成本难预测的问题,根据电力设备累积失效概率符合威布尔(Weibull)模型的特点,运用最小二乘法对Weibull模型参数进行估计,计算出设备的期望寿命,从而
通过分析目前火力发电厂锅炉燃烧优化调整方法所存在的问题,研究和开发出基于人工神经网络和遗传算法的锅炉运行优化管理系统。它通过机组实时运行参数的监测,以及机组变工况
介绍了趋势分析法、回归分析法、指数平滑法、单耗法、灰色模型法、负荷密度法和弹性系数法等电力负荷预测的方法,并以预测珠海市全社会年用电量为实例,在适用条件、数据形式
随着中国证券市场的不断发展,证券公司开展的业务由单纯依靠价格竞争转向以业务创新能力和投资水平为重点的非价格竞争。本文通过对我国证券公司资产管理业务存在的一些问题,
随着人工智能和自动化产业迅速发展,无人机智能系统的应用日益广泛。因为可见光波段相机在光线不足时拍摄效果不佳,无法适应变化场景应用,所以本文通过融合可见光图像和红外
运用分子生物学技术及多元统计分析的方法,跟踪湖泛爆发过程中细菌群落的动态及环境因子变化。结果表明:湖泛爆发过程中水质明显恶化,DO(溶解氧)、SD(透明度)、pH(酸碱度)显
<正>本文从同花顺网站选取迪士尼概念股的股价,用事件研究法进行分析迪士尼概念股的股价是否受迪士尼开园的影响。最终研究发现迪士尼项目给迪士尼概念股带来非常显著的正向