基于混合用户模型的协同过滤推荐算法研究

来源 :重庆大学 | 被引量 : 0次 | 上传用户:tzl1986
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
互联网的普及和电子商务的迅速发展造成了信息的过载,用户在大量的产品信息中难以找到需要的商品,由此,电子商务推荐系统应运而生。当前,电子商务推荐系统在实际运用中还不成熟,仍然存在许多问题,如推荐质量受到庞大而稀疏的用户评价数据的严重影响、系统的可扩展性能差、推荐实时性差等。论文针对推荐系统存在的主要问题,对电子商务个性化推荐系统中的用户模型和协同过滤推荐算法进行了有益的探索和研究。协同过滤是个性化推荐系统中应用最广泛和最成功的推荐技术,但是它也面临着推荐准确度和可扩展性两大挑战。协同过滤技术分为基于内存和基于模型两种,前者的推荐准确度更高,但可扩展性比后者低。论文提出了混合用户模型,基于该模型的协同过滤推荐系统既具有基于内存协同过滤的推荐准确度,又具有基于模型协同过滤的可扩展性。在用户模型层面,论文分析了目前的协同过滤推荐中经典用户模型存在的缺陷,利用商品组合特征和人口统计信息构建了混合用户模型。混合用户模型浓缩了项目内容描述信息、用户人口统计信息和用户-项目评分矩阵,提高了用户模型的信息浓度,在一定程度上解决了稀疏性和冷开始问题。混合用户模型引入的特征兴趣度,反映了用户对特征的偏好程度,在计算用户之间相似度时更为准确。在协同过滤算法层面,论文分析了当前电子商务个性化推荐系统中常用的协同过滤推荐算法存在的稀疏性、可扩展性、实时性和推荐准确度等问题,提出了基于混合用户模型的协同过滤推荐算法。该方法采用基于内容的过滤和基于人口统计信息的过滤离线构建用户模型,然后基于该模型运用协同过滤在线产生推荐。在特征层、模型层、协同过滤算法层三个不同层次引入组合,降低了系统的复杂性和计算时间,提高了可扩展性和推荐准确度。协同过滤算法层引入了遗传算法学习用户模型中每个特征的权重取值,使系统对用户偏好的描述更加准确。采用MovieLens数据集对论文提出的改进算法进行了仿真实验。实验结果表明:基于混合用户模型的协同过滤推荐算法在推荐的准确性、完整性、可扩展性等方面均优于实验对比算法。
其他文献
BLAS(Basic Linear Algebra Subprograms)定义了一组基本的矩阵和向量的操作,包括各种矩阵乘法和矩阵向量乘法,在许多领域有广泛的应用。现在的GPU已经发展为一种多核,多线程
数字图像具有形象、生动和直观等优点,己成为信息表达的主流方式之一,但在传输过程中也存在着诸多的安全隐患。因此,数字图像信息的安全问题己成为人们关注的焦点之一,研究图
现代汉语副词用法自动识别是面向自然语言处理的现代汉语副词知识库研究的重要内容之一,针对基于规则的现代汉语副词用法自动识别方法存在的不足,本文在已有工作的基础上,进
网络拓扑发现算法和实现技术是衡量网络管理系统性能的一个重要方面。本文通过开发网络管理系统网络拓扑发现服务模块过程中获得的理论和实践经验,从物理拓扑算法进行了积极的
序列模式挖掘是数据挖掘的一个重要分支,在金融通讯等领域应用中,序列模式挖掘发挥了重要的作用。虽然到目前为止,关于序列模式的挖掘算法已经相对成熟,但绝大部分算法都是面
工作流技术在软件开发领域得到了广泛的应用,基于工作流开发方式的软件同样需要软件质量控制体系来进行质量控制,而专门针对以工作流技术为开发方式软件的质量控制却鲜有研究。
自上个世纪90年代以来,面向对象的软件开发技术成为软件开发的主流技术,使得基于面向对象的软件复用被视为解决软件危机的一条现实可行的途径。按照复用的不同级别,软件复用
近年来,虚拟化应用场景日益增多,多用户拥有独立逻辑空间、共享后台资源,随着CPU计算资源和网络带宽资源大幅提升,存储资源逐渐成为性能瓶颈。固态盘(SSD)具有高性能、低能耗
学位
面对海量数据,利用图计算或机器学习等具有迭代特征的复杂应用对其进行处理很常见。通过在迭代之间共享缓存数据,典型的分布式内存计算系统如Spark极大地提升了迭代程序处理