基于聚类的推荐算法研究与应用

来源 :南京邮电大学 | 被引量 : 0次 | 上传用户:cuifangcuifang
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着Internet技术的迅猛发展,承载信息的数据量呈现指数级别的增长。面对如此巨大体量的数据,用户往往感到无从适应,定位自己需要的信息将变得更加困难,也尤为耗时。推荐系统应运而生,它可以根据不同用户的历史习惯、喜好等信息,有针对性地为用户进行个性化推荐服务。该服务可以主动地为用户推荐感兴趣的商品或项目,不仅能改善用户的体验,也能提高用户的归属感。推荐算法是推荐技术中最为重要的部分,在众多的推荐算法中,基于协同过滤的推荐算法运用的最为广泛。数据挖掘是在大量数据中发现潜在规律的技术,数据挖掘算法应用于推荐系统有助于提高推荐效率。本文重点对基于聚类的协同过滤推荐算法及其应用进行了研究。首先,针对基于用户的协同过滤算法UserCF中最近邻居集的计算是基于全局数据结点的特点,引入聚类算法来划分用户群,使邻居集的计算缩小到同一簇集内;为了提高聚类的准确性,对K-means算法做了改进,设计了基于最小生成树的K-means算法MST-K,该算法借助最小生成树进行初始聚类中心的选取,避免了初始聚类中心随机选取对聚类效果的不良影响,该算法用余弦相似度进行相似度计算,也解决了“相似不相同”的问题;通过进一步基于Spark平台对MST-K算法并行化,提高了其时间效率。其次,在UserCF算法的评分矩阵中引入用户的特征属性来降低初始评分矩阵数据的稀疏性,以提高推荐质量。以此形成了融合MST-K的UserCF算法M-UserCF;并且对M-UserCF算法进行了基于Spark平台的并行化设计与实现,测试了该算法的性能。最后,将所设计的M-UserCF算法应用于旅游线路的推荐,开发了一个“旅游线路”推荐原型系统并给出了应用结果。基于Spark平台的测试及应用结果都表明:并行化MST-K算法和并行化M-UserCF算法在大数据集上具有良好的准确性及时效性。
其他文献
只要是说起静脉输液,一般人就会联想到扎针和疼痛,特别是在静脉输注某一些药物时,患者会一直有疼痛感觉到静脉输液结束,如滴注复方氨基酸注射液时,患者常说局部疼痛,要求减慢低速,甚
在中国加入WTO之后经济实力迅速提升,再加上社会主义现代化建设的不断深入,使得中国的经济水平较以往有了显著的提高。在这个背景下中国的社会主义市场经济体制也日趋完善,这
网络舆情是社会舆情在互联网上的一种特殊反映,是干部群众对国家经、政、文和社会发展趋势以及人们普遍关注的社会热点难点问题在网上的集中反映。网络舆情具有直接性、突发
该篇文章从语法功能方面对《周易》古经中的虚词"于"字作穷尽性考察,并分析了其在《周易》古经中的主要用法。从而我们可以窥测到上古时期虚词"于"字的语法功能和作用,也为我
<正>出版社:清华大学出版社出版时间:2013-09-01ISBN:9787302335221所属分类:图书>计算机与互联网>编程语言与程序设计目前,数量众多的数据中心给企业、政府机关带来了非常沉
本文对国内近三十年的信用管理研究成果进行分析与归纳,按时间维度分为计划经济、商品经济、市场经济三个阶段。按空间维度分为宏观、中观、微观三个层面。为进一步的研究提
<正>评价企业的偿债能力,不仅要考虑资产负债表和利润表中的数据,还应考虑负债能力和盈利能力的指标。同理,评价企业盈利能力时,也应考虑其盈利能力和偿债能力指标。本文选择
金融监管体制的选择是一个备受争议的问题。国际金融危机以来,美欧等国陆续出台了一些金融监管体制改革措施。如何正确解读和借鉴相关国家的改革经验?对于美欧的监管体制改革
绘本可以为孩子提供丰富的想象、体验的机会,我们可以巧妙的运用绘本,让孩子带着好奇、兴奋的心情融入绘本的故事情境,并透过有意义的提问和引导,培养幼儿的表达能力、想象力
介绍光储充一体化解决方案,对不同住宅小区及场景进行比较及推广。