基于混合算法的个性化推荐系统研究与实现

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:song0719
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着信息技术的快速发展,互联网用户量和信息量规模不断扩大,海量的信息资源导致了信息过载。推荐系统是解决信息过载的有效方法。但是,现有的推荐系统仍存在稀疏性、冷启动等问题。为此,本文首先提出一种基于Bhattacharyya系数的相似度计算方法,来解决推荐系统中的数据稀疏问题;接着,提出基于标签感知的混合神经网络模型,来解决标签推荐中存在的稀疏、冗余和语义模糊问题,同时缓解了冷启动问题;最后,结合上述两种方法搭建一个完整的个性化推荐系统,实现对用户的个性化电影推荐。本文主要工作如下:(1)针对传统协同过滤算法在相似度计算时存在数据稀疏的问题,本文提出了基于Bhattacharyya系数的相似度计算方法。首先,通过项目评分分类标准对项目评分等级进行分类,实现同类别项目之间相似度的快速计算,有效降低计算成本;接着,利用Bhattacharyya系数实现从概率分布的角度计算项目相似度,打破了共同评分项目的限制;最后,考虑到不同项目之间相似度计算结果的重复性问题,引入了共同评分项目增强函数,进一步对相似度计算方法加以优化。实验结果表明,相较于现有相似度计算方法,改进的相似度计算能够有效地解决推荐过程中数据稀疏性问题,提高了推荐准确率。(2)针对推荐系统中的异构信息融合问题,本文提出了基于标签感知的混合神经网络推荐模型(Hybrid Tag-aware Recommender Model,HTRM)。首先,词嵌入模型分别对评分和标签进行嵌入表示;接着,自编码器对项目标签进行文本特征提取,同时使用长短期记忆网络(Long Short-Term Memory,LSTM)对用户标签行为进行特征提取;最后,采用全连接神经网络对融合的用户和项目特征进行评分预测。实验结果显示,优化的推荐模型有效降低了用户评分预测误差,同时缓解了冷启动问题。(3)基于上述研究,本文利用B/S架构实现个性化电影推荐系统,其基本结构包括系统前端和后端。具体地,前端采用Vue框架开发,通过浏览器向用户进行界面展示;后端业务主要使用Spring框架实现。核心推荐引擎部分分别采用基于Bhattacharyya系数相似度计算的协同过滤和HTRM,设计了离线推荐服务和实时推荐服务,实现对用户的个性化电影推荐。
其他文献
近年来,随着网络技术的迅速发展,网络上传播的恶意流量也呈现高速增长态势,这些恶意流量严重威胁着网络安全。因此,对恶意流量识别展开深入研究对于网络安全领域至关重要。和机器学习相比,深度学习在计算量和计算深度上都有质的飞跃,并在许多领域已经远超经典机器学习方法,包括语音、自然语言、视觉等。单任务深度学习模型已被广泛用于解决流量分类问题,但是,如果一个任务的数据量有限或者高维,那么模型可能难以区分相关与
在智能电网不断发展的过程中,电网的通信、计算、控制能力得到了极大的提升,电力物理侧和信息侧之间的交互不断增加,体现出电力信息物理系统(Cyber-Physical System,CPS)的特征。信息物理的耦合特性在提升了电网可观性的同时,也对信息侧的安全性提出了严格的要求。网络攻击通常会在信息侧注入,破坏信息正常传输并通过信息物理耦合关联影响物理侧的安全稳定运行。因此本论文针对电力CPS中网络攻击
网络流量分类在网络资源管理和服务质量保证中扮演重要的角色。随着网络数据加密和移动流的广泛应用,给传统的流量分类方法造成很大的挑战。而网络流量分类是网络资源管理和Qo S(Quality of Service)保证的一个重要组成部分。网络提供商可以利用流量分类技术,改善网络管理政策来实现更好的资源的分配和服务质量保证,从而为用户提供更好的网络服务。本文提出了一个将特征生成和LSTM(长短期记忆人工神
随着工业技术进一步发展,工业产品复杂度不断提升,各行各业对于产品的检测方式发生了变化。所需获取的信息已经不再满足于产品二维图像,而是对其三维信息提出了要求。三维测量技术能够完成对产品的三维缺陷检测,并且可以大幅提高生产效率,减少品质控制成本,对提升工业制造技术具有重大意义。应用在工业上的产品三维信息获取系统,具有测量速度快、集成程度高等特点,并且需要适应工业流水线环境下的高速检测方式,是工业制造中
无线传感器网络是信息领域的研究热点之一,可用于特殊环境的信号采集、处理和发送,是一种全新的信息获取和处理技术。受限于传感器网络自身的特点,能量问题一直是限制其应用的一个重要因素。本文对传统的SPIN(Sensor Protocol for Information via Negotiation)路由协议进行研究,从不同角度对其改进,实现网络性能在节点能耗、吞吐量和传输时延等方面的提升。本文的主要研
近年来,随着物联网的发展,边缘计算逐渐兴起,边缘计算是指在网络边缘测的分布式计算平台,更加靠近用户终端,多接入边缘计算作为云计算和边缘计算的补充,扩展了边缘计算的定义和应用,使其在网络边缘节点提供各类信息技术业务,能够同时为移动用户和固定用户提供边缘计算服务,将计算任务和数据迁移至边缘节点进行处理,从而有效节约了传送至远程数据中心的带宽。在多接入边缘计算产业蓬勃发展的大环境下,安全问题已成为阻碍其
社会的快速发展给人们的生活提供很多方便、带来很多福利,相反的,也引起一些无法逃避的环境问题,如恶劣的天气。雾霾已经成为一种常见的天气现象,不仅危害人们的身体健康,还会使户外采集设备收集的图像出现对比度低、清晰度低和色彩偏移等问题,所以在计算机视觉领域,图像去雾分支备受关注。大气散射模型结合暗通道先验去雾算法(Dark Channel Prior,DCP)虽然复原效果很好,但是依旧存有很多问题,后来
随着移动互联网的迅猛发展,通信业务种类不断增长造成网络流量持续上升,对传统网络资源分配问题提出巨大挑战。SDN和NFV技术增强了网络的灵活性和扩展性,通过网络切片能够为各种业务需求提供灵活的资源分配,在此过程中VNF的编排、部署和调度是非常关键的问题,决定了网络服务性能和用户体验优劣。同时,随着网络技术在生活中的广泛应用,人们对通信质量和数据隐私提出了更高的要求,于是SFC的安全问题就变得非常重要
随着通信与网络技术的飞速发展,网络流量呈现了爆发式的增长,而在这些网络流量中往往混杂了威胁着网络安全的恶意流量,如何及时检测和处理潜在的恶意流量,已经成为互联网时代下实现网络安全的重要目标。近年来,机器学习应用于恶意流量识别逐渐成为研究热点,但是现有的基于机器学习的恶意流量检测方法大多是利用大量已标记的数据进行模型训练,即采用有监督的机器学习方法来实现对恶意流量的检测与识别。然而,对流量数据进行逐
以自主研制的动态指向式旋转导向钻井工具原理样机为研究对象,在分析陀螺仪、三轴重力加速度计噪声特性的基础上,深入研究测量信号的处理方法,实现了对稳定平台转速、重力工具面角的准确测量。首先,介绍旋转导向钻井工具的国内外研究现状,对比不同旋转导向钻井工具的工作原理,分析动态指向式旋转导向钻井工具的优势,明确课题研究目标。其次,介绍定向钻井参数与动态指向式旋转导向钻井工具的工作原理,着重介绍其测量系统,并