基于用户聚类的个性化推荐方法研究

来源 :江西财经大学 | 被引量 : 0次 | 上传用户:a76s333
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
近年来,互联网技术的迅猛发展使得Web成为人们获取信息的重要方式,用户在面对愈加丰富的信息海洋和各种类型的信息,反而迷失其中。推荐系统可以缓解“信息过载”引发的“信息迷失”问题。聚类技术应用到推荐中可以缓解数据稀疏、扩展性和冷启动等问题,但聚类技术的引入并不是都能提高推荐的效果。这是由于聚类方法本身具有一定的缺陷,如聚类质量不高、聚类结果不稳定等,再把这种不是很好的聚类结果应用到推荐中,必然会造成推荐质量下降。如何巧妙地将聚类技术运用到推荐系统中来提高推荐结果的准确率是基于聚类的推荐研究的重点。本研究的思路是:通过聚类技术建立用户聚类模型,利用该模型产生的填充评分可以解决协同过滤中数据稀疏性问题,同时,利用该模型来配置物质扩散算法中非均匀的初始资源值。基于此研究思路提出了两个推荐算法,合并聚类用户评分的协同过滤推荐算法(UCCF)和基于用户聚类的非均匀资源配置的物质扩散推荐算法(UCMD)。该推荐算法主要利用了聚类技术,把产生的用户聚类模型引入到推荐中。本论文的主要研究内容包括如下三个方面。(1)针对传统协同过滤推荐算法面临的数据稀疏问题,提出一种合并聚类用户评分的协同过滤推荐算法。首先对用户聚类,把目标用户所在聚类的其他用户作为近邻,合并聚类邻居的评分可以产生新的评分项,把这些评分填充到原有评分记录里。在新的评分数据下,我们重新计算用户间的相似度,通过这样的方法查找到的近邻较传统方法查找到的准确性更高,根据更加精准的近邻集合计算得到的预测评分准确率也更高。(2)针对二部图网络结构的推荐算法中物品的初始资源值设置为0/1的做法,提出一种基于用户聚类的非均匀资源配置的物质扩散推荐算法。首先根据用户对物品的评分对用户聚类,接着依据聚类模型,对目标用户选择过的物品和与目标用户在同一个聚类的用户选择过的物品设置不同的初始资源,最后利用经典的物质扩散算法进行后续推荐。(3)利用MovieLens站点上真实的数据集测试本研究提出的合并聚类用户评分的协同过滤推荐算法(UCCF)和基于用户聚类的非均匀资源配置的物质扩散推荐算法(UCMD)。UCCF算法的实验结果表明:在利用用户聚类模型填充评分之后的数据上和没经过填充的评分数据上使用标准协同过滤算法,前者的平均绝对误差(MAE)要低得多。UCMD算法的实验结果表明:算法在分类准确率、排名权重、用户与用户之间的多样性指标上都优于标准的物质扩散,新颖性和标准物质扩散持平,算法在提高推荐准确率的同时也提高了推荐的多样性,而且新颖性也保持在较高水平。
其他文献
随着环境保护要求增强和竞争的需要,越来越多的企业除了继续努力改善传统供应链之外,在逆向供应链上投入大量的精力。逆向供应链是企业通过采取一系列活动,从消费者回收使用
随着中国老龄化的加重,养老问题逐渐受到社会各方的关注。一对夫妻赡养四到六位老人的现象较为普遍,子女养老压力大,传统的家庭养老模式难以维系。而机构养老也面临诸多问题,一方
医药配送中药品种类的增多和规模的扩大对目前的医药仓储水平提出了更高的要求,密集仓储系统应用于医药仓储领域的需求愈发迫切。穿梭板式密集仓储系统是一种由穿梭板、堆垛机
因为人们有限的处理信息能力和主观上的偏见,所以面对面的协商很少能达成有效的协商。近年来学者将人工智能领域的知识运用到多议题协商中。随着电子商务的异军突起,基于Agent
改稿,是报刊编辑的责任。但如何改稿,其中却大有学问。改稿中应注意的事项不少,但最要切忌的我认为是三个字:“想当然”。不必要的增添,好似画蛇添足,故然不好;照个人胃口删
研究生招考工作是我国最高层次人才选拔的入口,合理的选拔制度不仅是研究生培养质量的基本保证,而且直接影响到国家科教兴国的基本国策。随着我国研究生招生的报名和录取人数的
医院要在激烈的竞争中立于不败之地,求得可持续发展,就要积极参与市场的竞争,不仅要提高医疗服务质量,而且要使医疗服务的价格有所降低,这就需要通过不断降低成本来获取竞争优势。对单病种成本差异的监测与控制是医院成本管理工作必须要重视的一个环节。本文针对现阶段成本差异分析模型的局限性以及医院系统的特殊性,提出了基于模糊贝叶斯规则的成本差异分析模型和基于BP神经网络及差分进化算法的成本差异分析模型并将其应用
市场环境多变、竞争激励,企业不可避免地会遇到各种财务风险。现金流量状况直接体现企业持续经营能力和企业的内在价值,是企业兴衰成败的最直接原因,现金流量对于企业的成长
听两小时枯燥无味的讲话,令人疲劳不堪,然而同样长短的相声专场,则能在捧腹之余,疲劳尽驱。这就提出一个问题,究竟用什么方式传递语言最易于为人们接受呢?实践证明,最易于为
今年是新中国成立三十周年的大庆,作为一个新闻战线上的从业人员,我建议:报纸多登些新闻图片! 新闻图片,是我们新闻报道的一个重要方面。在战火纷飞的年代里,新闻摄影工作者