基于谱聚类的个性化推荐系统研究

来源 :福建农林大学 | 被引量 : 1次 | 上传用户:px520
下载到本地 , 更方便阅读
声明 : 本文档内容版权归属内容提供方 , 如果您对本文有版权争议 , 可与客服联系进行内容授权或下架
论文部分内容阅读
随着web2.0和电子商务的快速发展,信息资源正在指数型增长。目前,解决信息过载的一种有效方法就是采用推荐系统,而协同过滤是推荐系统中运用最广泛的算法,但是其依然存在数据稀疏性、可扩展性以及冷启动等问题。与此同时,大多数个性化推荐系统往往忽略用户本身的一些特征属性,比如年龄、性别和职业,在用户-项目评分数据难以获得的情况下,会严重影响个性化推荐系统的推荐精度。在分析比较各种常用个性化推荐算法及相关技术之后,本文以数据稀疏性和冷启动问题为立足点,旨在提高个性化推荐系统的推荐精度并降低推荐算法的时间复杂性,对基于谱聚类的个性化推荐系统进行了研究,具体研究内容包括:(1)将谱聚类引进到个性化推荐系统中,利用加权核模糊聚类和初始质心选择算法对谱聚类进行改进,并修正Person相关性。最后将改进的谱聚类和相似性度量方法与协同过滤结合,得到了两种改进的基于用户谱聚类的协同过滤推荐算法。在MovieLens 100K数据集上,上述两种算法的平均绝对误差(Mean Absolutre Error, MAE)以及均方根误差(Root Mean Square Error, RMSE)较传统的K-means聚类协同过滤算法至少降低了4%,运行时间至少减少了一半;在MovileLens 1M数据集上,MAE与RMSE值至少改善了2%,运行时间减少了80%。(2)基于用户特征属性,提出了用户年龄、性别、职业的预处理方式,获得用户特征属性矩阵后,提出了基于用户特征属性谱聚类协同过滤算法。(3)针对偏差奇异值分解(Bias Singular Value Decomposition, BSVD)算法存在的过拟合问题,综合利用用户特征属性和用户-项目历史评分记录,将上述所提出的基于用户特征属性谱聚类与BSVD模型相结合,并在模型中增加了一个新用户判断来解决冷启动问题,最后得到了一种改进的推荐算法。在MovieLens 100K数据上,该算法与BSVD分解算法相比较,其MAE和RMSE值至少减少了6%,在数据集MovieLens 1M上,MAE与RMSE值至少降低了2%。实验表明,该算法不仅提高了推荐准确率并具有一定的可扩展性。(4)利用已有的数据集合设计多个实验,将提出的算法与传统的算法进行验证比较,通过实验可以得出,将谱聚类运用到个性化推荐系统中能够大大地提高预测精度和系统的实时响应速度,最终为企业和商家带来更大的经济收益。
其他文献
随着多种数据自动采集技术、移动互联网、物联网、云计算的快速发展,在经济、生物等各领域在迅速积累着大量数据,由此产生的数据维度越来越高。变量数大大超过样本数,即“大P
序号时间地点人数会期活 动 名 称主 办 单 位112月武汉 80 0 6天 中国体育科学学会第 5届全国代表大会暨第 6届全国体育科学大会学会办公室、武汉体育学院2待定北京 2
自MM定理问世以来,企业资本结构问题便成为了金融领域中最为重要和复杂的问题之一。国内外学者从不同角度对公司资本结构与经营绩效的关系进行了大量的理论和实证分析,但仍没有
在金融市场高度发达,银行面临的风险日趋复杂的经营环境下,经济资本管理是现代商业银行加强风险管理和内部资本管理的重要手段。商业银行作为经营风险的特殊企业,风险、资本与价
心脑血管病是中老年人的常见病,如不及时治疗会越来越严重,还会引发别的病,甚至危及生命。患有冠心病和脑供血不全的人常感到舌头发麻、活动不灵、说话不清等症状,这是因为舌
经济周期是指经济的短期表现对其长期趋势的一种偏离,这种偏离可能会带来繁荣,亦有可能造成经济的衰退甚至是萧条。作为社会经济的一个重要主体,商业银行的经营活动不仅受到经济
早期的风力发电机轴承失效频繁发牛,原因多种多样,在研究应用条件和调查轴承失效的基础上,基本确认了造成轴承失效的根本原因:双馈感应发电机变频驱动所导致的轴承过电流和相
文章从图书馆管理范畴,谈时代发展对图书馆管理的创新要求并根据自身的学习体会,探讨了目前我国图书馆管理应该把握几个关键环节,与大家商榷.
期刊