基于聚类的个性化推荐算法研究

来源 :电子科技大学 | 被引量 : 21次 | 上传用户：huoqiyin

【摘要】

：

随着互联网技术的快速发展，互联网上信息数量成指数级别增长，网络信息的产生速度超过人们能接收的程度，信息过载情况严重，而信息质量参差不齐导致有用信息淹没在信息海洋中。以搜

【作者】

：

雷震

【出处】

：

电子科技大学

【发表日期】

：

2013年01期

【关键词】

：

推荐系统协同过滤聚类

下载到本地 , 更方便阅读

下载此文赞助VIP

声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架

论文部分内容阅读

随着互联网技术的快速发展，互联网上信息数量成指数级别增长，网络信息的产生速度超过人们能接收的程度，信息过载情况严重，而信息质量参差不齐导致有用信息淹没在信息海洋中。以搜索引擎为代表的信息检索技术存在着需要用户主动提供明确的检索目标的局限性，以协同过滤思想为代表的个性化推荐技术应运而生，成为解决互联网信息过载问题的有效途径。传统的协同过滤算法根据其他用户对项目的评价来预测目标用户对项目的偏好，在用户项目评分矩阵上寻找最近邻居进行推荐，并没有将电子商务系统中存在的用户属性信息和项目属性信息有效利用，导致准确率差；在查找目标用户的最近邻居关键步骤中需要在整个用户空间查找，存在着推荐实时性差的问题；对用户评分矩阵稀疏度敏感，在稀疏度高的系统中存在着准确率急剧下降的问题。聚类技术能有效对对象划分成组，使得同组对象之间属性相似度高，处于不同组的对象相似度低，而协同过滤推荐算法的核心步骤也是通过计算相似度寻找目标用户的相似邻居，将聚类技术应用到推荐当中能有效的提高推荐系统的性能。首先，针对协同过滤推荐的实时性问题，介绍了在用户项目评分矩阵上先对用户聚类，在与目标用户相似度高的聚类簇中查找最近邻居的方法，有效的降低了查询空间，提高推荐实时性。上述方法是在用户项目评分矩阵上进行，没有结合项目属性信息，提高实时性的同时带来准确率下降，本文提出了一种衡量用户对项目属性喜好程度的方法，将其用于上述聚类过程中，在保留了查询空间降低的优点同时，提高了推荐准确率。其次，针对推荐准确率差的问题，本文提出了将引入模糊化改进的K-means算法在商品属性矩阵进行对项目进行聚类，然后融合模糊聚类中项目对聚类簇的归属度相似度和用户评分矩阵上计算出的相似度，通过实验表明本方法在准确率上优于传统的混合推荐。最后，针对用户评分稀疏性问题，本文提出用Fuzzy K-means模糊聚类算法分别在用户属性矩阵、项目属性矩阵上聚类，将聚类簇中的平均值加权融合作为对稀疏矩阵的填充值。实验表明该方法能有效的解决数据稀疏性带来的准确率降低的问题，相对于其他对稀疏矩阵填充方式具有优势。针对Fuzzy K-means聚类对初始聚类中心的选择敏感的问题，本文提出了一种计算初始聚类中心的方法对其改进，并将改进后的算法应用到上述推荐过程，实验结果表明改进的模糊聚类在上述基础上推荐效果仍有提高。

其他文献

明末清初祥符周氏家族文学活动研究

祥符周氏家族是明末清初著名的文学世家,连续四代,名人辈出,代表人物有：第一代文人周庭槐、第二代文人周文炜、第三代文人周亮工以及第四代文人周在浚、周在延、周在都等,在文

学位

周氏家族文学活动周亮工周在浚

找寻话语的坐标——一种复杂性文学话语理论

进入新千年以后,沸腾了数十载的文学理论研究终于显露出疲态,欲振乏力了。伊格尔顿因此预言,文学批评即将进入一个后理论时代。国内也有人断言"文学理论已死"。文学理论仿佛

期刊

文学话语文学理论话语霸权伊格尔顿文论研究文学批评理想自我逃避现实生存需求互动关系

WLAN网络建设策略及其与3G网络融合分析

文章从联通运营商WLAN业务发展的现状出发,对WLAN建设过程中存在的问题进行详细的分析和研究,根据原因提出有效的建设策略,并对3G网络的融合进行全面的阐述。

期刊

WLAN网络建设策略3G融合WLANnetworkconstructionstrategy3Gfusion

建国以来中国共产党关于文化发展战略及文化建设的研究

文化是民族的灵魂，是一个国家综合国力的重要组成部分，当代综合国力的竞争不仅仅是经济实力的较量，更体现在文化的渗透，所以必须使自己的传统的文化适应新的世界性文化的发展。21

学位

中国共产党文化文化建设文化发展战略

基于动态功率分配Doherty功率放大器的研究

随着现代无线通信系统的快速发展，尤其针对目前正在大力推进的LTE通信系统，发射机普遍采用高端频谱调制技术，使得对发射机中功率放大器的效率要求越来越苛刻，因此对高效率功率放

学位

Doherty功率放大器功率分配网络效率线性度

大数据分析技术的研究

在基于云的环境中,分布式数据中心承载大型数据存储库,同时提供用于分析的处理资源,有力地激发了有效并行/分布式算法的需求。这给大数据分析的潜在社会经济效益和应用特性的

期刊

大数据数据存储数据分析big dataData storageThe data analysis

Furlow氏腭裂修复术的临床经验及疗效观察

ue＊M＃’＃dkB4＃＃8＃”专利申请号:00109“7公开号:1278062申请日:00.06.23公开日:00.12.27申请人地址:（100084川C京市海淀区清华园申请人:清华大学发明人:隋森芳文摘:本发明属于生物技

期刊

腭裂修复术腭咽闭合

置入胃管法的进展

为提高置入胃管的一次成功率,综述了1998年以来临床常用的一些置管方法.主要介绍了刺激置管法、气管切开置管法、支撑辅助置管法、给药后置管法、舌后坠置管法、不同体位置管

期刊

置入胃管护理进展

新辅助化疗在ⅠB2-ⅡB期宫颈癌治疗中近期疗效研究

目的研究新辅助化疗在ⅠB2-ⅡB期宫颈癌治疗中近期治疗效果，其对临床宫颈癌根治性手术和术后病理不良因素的影响；比较静脉化疗和动脉栓塞化疗两种不同途径新辅助化疗方案在ⅠB2

学位

新辅助化疗宫颈癌动脉栓塞化疗静脉化疗

基于分形与混沌理论的大豆期货市场的特征研究

我国商品期货市场的发展时间较短,只有二十几年,在各方面都处于起步阶段。但即便如此,农产品期货在套期保值和维护市场稳定方面的作用也已经愈发显著。因此,对于金融研究人员

学位

重标极差分析法Hurst指数分形维相空间重构Lyapunov指数

基于聚类的个性化推荐算法研究

与本文相关的学术论文