基于混合过滤技术的文章推荐系统研究

来源 :广东工业大学 | 被引量 : 0次 | 上传用户:l447863596
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着移动互联网的迅速发展和移动终端的普及,微信成为人们学习生活中不可或缺的社交软件。移动端的文章推荐软件不断涌现,推荐效果不尽相同。在文章推荐领域,协同过滤推荐算法与基于内容的推荐算法是使用最广泛的两种推荐算法。由于协同过滤推荐算法存在数据稀疏性和冷启动问题,而基于内容的推荐算法又有过度规范问题,即不能为用户发现新的感兴趣的资源,只能发现和用户已有兴趣相似的资源,缺乏新颖性,因此本论文通过结合协同过滤推荐算法和基于内容的推荐算法,采用加权混合的方式提出一种基于混合过滤技术的文章推荐算法,在此过程中,本论文展开了如下工作:  针对协同过滤推荐算法因数据稀疏导致推荐准确率不高的问题,提出一种混合协同过滤推荐算法,该算法结合基于用户的协同过滤算法和基于物品的协同过滤算法,采用改进的皮尔逊相关系数相似度计算方法来获取用户的最近邻居,然后通过对稀疏评分矩阵的二次填充来对项目进行评分预测。实验结果表明本算法比传统协同过滤算法有更好的效果。  针对公众号推荐文章问题,提出了基于协同过滤推荐算法和基于内容推荐算法的混合推荐算法,算法分为三步:  1、使用基于内容的推荐算法,利用Python与Scrapy爬虫框架获取微信公众号发布的所有文章,通过分析指定微信公众号发布的所有热门文章,提取热门文章关键词进行词频统计,将微信公众号文本内容向量化,再使用文本相似度算法从文章库中选出与指定微信公众号热门文章主题相似度排名靠前的文章进行推荐;  2、使用协同过滤推荐算法,在微信公众号-文章矩阵基础上,使用基于用户协同过滤技术,计算得到与指定微信公众号特征相似度靠前的微信公众号列表;  3、将基于内容推荐算法得到的推荐文章列表与协同过滤推荐算法得到相似公众号列表进行加权混合推荐形成最终推荐列表。通过实验证明,本论文设计的基于微信公众号平台混合推荐的文章推荐系统最终推荐结果比随机抽取微信公众号热门文章进行推荐的准确度更高,与单纯的基于内容的推荐算法相比,能有效提高推荐新颖度,本论文改进的混合推荐算法在微信公众号推荐上达到了预期结果。
其他文献
近年来,互联网在世界范围内蓬勃发展,其承载的信息量更是急剧膨胀。互联网承载的数据一部分是可以从Web页面上直接获取的表层数据,另一部分是以结构化方式存储于数据库中的Deep
计算机辅助几何设计中,曲线、曲面有两种基本的表示方法:参数形式和隐式形式。在实际应用中这两种表示方法有着各自的优缺点。参数曲线曲面具有构造简单直观、易于显示等特点,又
当今世界计算机和互联网技术的不断发展和带宽的快速增加,P2P的文件共享占据了网络绝大部分流量,成为互联网文件分发的主要模式之一。P2P文件共享就是P2P技术技术发展的动力源
近年来,一门新兴学科——数据挖掘,引起了人们的广泛关注,被应用到模式识别、统计学、数据库等众多领域。社会网络作为其中一个应用方向迅速发展,并且成为一个研究热点。对于社会
Reed-Solomon码是一种在移动通信,深空通信,数字存储中广泛应用的非二进制的循环纠错码。它具有严格的代数结构,对随机错误,突发错误和删除错误都有良好的纠错性能。本文主要研究
随着网络通信技术的发展及社交工具的普及,QQ、微信等即时通信工具得到了广泛应用,产生了大量的用于交互的短文本。这些交互式的短文本中包含了丰富的信息资源,具有很高研究价值
对等网络作为区别于传统C/S集中模式的全新共享方式,因其全网节点的参与互动性和平等性赢得了越来越多研究人员的青睐。对等网络按照结构类型可分为结构化和非结构化两种模式,
越来越多的软件系统部署在动态、开放和不可预测的环境中,为了提高系统的灵活性和健壮性,人们希望软件实体能够感知外部环境的变化,并根据环境变化和内部状态不断调整自身的
随着互联网的迅速发展和普及,因特网和计算机网络面临越来越多的安全威胁。网络攻击的直接表现是网络流量异常,这就要求必须快速有效的检测出异常。为了保护目标系统和网络免受
随着嵌入式技术、信息技术和网络技术的快速发展,信息世界和物理世界紧密的联系在一起,在这种的背景下CPS应运而生。CPS是物联网的智能化扩展,也是下一代网络化机电一体化控制系