基于社区划分的协同过滤推荐算法研究

来源 :中国科学院大学 | 被引量 : 0次 | 上传用户:nilaopopodi
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网技术的迅猛发展,互联网中的资源呈现出爆炸式增长的态势。如何从海量的资源中准确定位到适合用户的资源逐渐成为工业界和学术界的研究热点。推荐系统在这样的背景下应运而生。  协同过滤推荐是推荐系统中应用最广泛也是最成功的技术,但因存在数据稀疏性和精确度不够等问题,影响了协同过滤推荐系统的发展。本文在分析总结基于内容推荐和协同过滤推荐的优缺点的基础上,引入社区划分思想,将社区划分与协同过滤推荐算法相结合,提出一种基于社区划分的协同过滤推荐算法,旨在解决协同过滤推荐中数据稀疏性和推荐准确率问题。本文主要研究内容如下:  (1)针对传统协同过滤推荐算法的数据稀疏性问题,提出一种基于项目类别的社区划分解决方案。使用项目的类别提取出能表达用户偏好的特征向量,利用该特征向量对用户进行社区划分,缩小待推荐用户的最近邻用户的范围,缓解数据稀疏性。  (2)为提高推荐准确性,提出一种融合用户评分和用户标签的相似性计算方法。根据用户的标签和评分信息提取出用户基于标签的相似性和用户基于评分的相似性,使用平衡因子衡量二者的比例综合得到用户相似性,以能更全面准确地反映用户的相似性。  (3)基于社区划分和改进的相似性计算方法,提出一种基于社区划分的协同过滤推荐算法。从划分的社区中使用改进的相似性搜索最近邻用户集合,根据最近邻用户集合的用户评分预测待推荐用户的评分并进行推荐。以MoviesLens数据集为实验数据,实验结果表明,所提算法能显著提高评分预测的准确性和推荐结果的质量,并验证了社区划分以及用户标签信息对推荐系统的重要性。
其他文献
同步电路系统以其结构简单、实现方便等优势始终占据着VLSI设计的主流位置,然而当CMOS工艺进入到深亚微米乃至纳米时代,同步电路的时钟偏差和片上波动日渐严重,功耗问题越发突出
素数的研究已经有两千多年的历史,从古希腊数学家欧几里得(Euclid)开始,无数的数学家为此付出了毕生心血,也取得了一个又一个巨大的成绩,而信息技术和密码学的迅猛发展给它带
改革开放以来,我国大力引进利用国外资金、先进技术和先进管理。为了鼓励外商投资,我国设立了进出口加工区和保税区,区内的外商投资企业享有购买设备、零件和生产所需材料等
如何有效的管理和利用互联网上快速增长的信息资源是现代网络亟待解决的一个问题。随着现代加工技术和硬件技术的发展,P2P在现实生活中的大规模应用成为现实。它通过尽可能利
在信息时代,所有事物都变得更快捷和动态,传统的科层组织往往难以对迅速变化的外部市场作出及时的反应,组织内关注的焦点也从垂直的职能或部门转换到组织内运作的各种水平的
越来越多的新型网络呈现出长链路延迟、高链路差错率、端到端的路径断开频繁、存储能力有限、缺乏连续的能量供给等特点。这些网络在网络体系结构和性能特征等方面都和Intern
近年来,对三维人脸重构和动画的探索持续升温,已成为虚拟现实领域的研究热点。进入21世纪后,伴随着通讯技术、娱乐影视产业的蓬勃发展,计算机人脸重构和动画有着越来越广泛的
近红外光谱分析技术是一种新兴的分析检测技术,与传统的化学分析方法相比具有速度快,无污染,操作方便等优点,近年来发展迅速,广泛的应用在物品的定性和定量检测中。   同时,奶制
图形处理软件是指以图形数据对象为核心,提供对图形数据对象进行编辑、存储等各种操作的应用软件。用户需要图形处理软件提供一个相对独立的应用程序、并且构成软件的各个模块
随着地质勘探、测井解释技术的不断发展,测井原始数据作为测井解释的基础,其数据格式、信息量对于测井解释平台以及日后的解释工作都起着至关重要的作用。  在实际应用中,由于