基于标签关联规则的协同过滤算法研究

来源 :河北工业大学 | 被引量 : 1次 | 上传用户:b479676614
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着互联网的快速普及,信息检索工具的发展经历了三个阶段:从分类导航到搜索引擎,再到现在的推荐系统。推荐系统及相关推荐技术已经不知不觉中深入了人们的生活中,无论是视频网站、音乐网站或APP、社交网站、甚至是平日浏览的新闻网站都离不开推荐技术,处处能看到推荐技术的痕迹。传统的基于协同过滤推荐算法存在很多的缺陷,如稀疏性问题、冷启动问题、可扩展性问题、用户多兴趣问题等等。协同过滤算法只考虑用户间或项目间的相似性来给用户进行推荐,忽略了用户对项目的主观感受。随着Web2.0的发展,在社会化标注系统中加入的标签(TAG)元素为用户提供了一种新的方式来表达对项目的主观感受。标签体现了用户对项目的观点和用户的兴趣,而且也实现了对项目内容相对精确的描述。通过对用户产生的内容(UGC)来对互联网中的户进行社会兴趣挖掘具有非常重要的意义。本文提出了一种引入用户自定义标签内容的基于标签关联规则的协同过滤算法。算法在对评分矩阵填充的过程中引用了基于项目的协同过滤方法,有效的解决了传统的协同过滤算法的稀疏性问题。接着对用户的相似度的计算进行了改进,引入了用户关注度矩阵,对用户评分相似度和用户关注度相似度两部分相似度进行了改进。在这里我们引入Apriori关联规则中计算频繁项集的思想,训练出合适的最小支持度阈值,求出频繁项集,对频繁项集分解得到用户兴趣点,再逆向遍历用户集合,按照用户兴趣点对用户进行聚类。得到用户聚类后,按照前面介绍的改进的用户相似度方法,求出最近邻居用户集合,进而求出用户对项目的预测评分,最后将结果推荐给用户。实验采用MovieLens电影评分数据集,通过一系列的实验对各推荐算法进行对比。实验表明该方法能有效的降低评分矩阵稀疏带来的影响,提高了预测精度。
其他文献
静态图像压缩的关键在于充分利用象素间的相关信息.在小波图像压缩中,相关信息体现为小波变换系数的邻居、父子和兄弟等相关性,典型的小波图像压缩算法如EZW、SPIHT和JPEG200
维吾尔语命名实体识别和翻译是维汉机器翻译的基础任务,也是信息检索、信息抽取、智能问答等技术的基础,研究并实现有效的维吾尔语命名实体识别与翻译系统是本文的主要研究内容
该文根据构件模型之间的差异,利用现有的构件组装技术,在论文中提出了构件包装器,改进了现有的构件组装模型,构成异构构件组装模型,试图部分地解决异构构件组装的问题.模型包
该课题以国家863重点项目"分布式虚拟环境DVENET(1998年—2004年)"为背景,在织物类柔性物体仿真以及织物自碰撞问题处理方面展开研究工作.重点是在满足虚拟现实系统实时性和
本文着重讨论GIS中的组件技术及其在水情测报中的应用,所作的工作、技术难点及创新如下:①网格追踪法实现等值线讨论利用已知均匀D E M网格和离散测值点,生成等值线的方法.同
计算机网络的出现改变了世界,日新月异的网络新技术则有力地推动着这种改变不断深入.最近几年内,人们的工作、生活、娱乐越来越多地依赖于网络的支持,这种依赖性的不断加深使
随着互联网的发展和日益广泛的应用,网络入侵也变得越来越严重,研究具有实时性与正确性的自动入侵响应系统,对于增强系统抵御攻击能力、保护自身资源具有重要意义,而其中如何
随着多媒体通信技术的发展及数据压缩技术的成熟,多媒体正逐步渗透到计算机应用的各个方面.多媒体应用在空间上有数据量大、在时间上有实时性和连续性的特点,这对操作系统的
视频信息具有直观、具体、生动等优点,在工农业生产、军事侦察和日常生活等领域发挥着重要作用.由于数字视频的数据量巨大,故而视频编码成为数字视频处理和应用中的关键技术.
近几年因特网的发展很快,在其给社会带来巨大利益的同时,计算机和网络系统的安全也成为了一个非常令人关注的问题.传统的保护计算机或网络系统安全的方法是在网络周围建立一