论文部分内容阅读
随着互联网和信息技术的快速发展,网络上积累了越来越多的信息资源,如何在海量的信息中挖掘有用的信息资源变得越来越困难.面对众多的网络信息,用户无法抉择时,推荐系统可以帮助用户发现对自己有价值的信息,同时还能让一些用户未知但是可能感兴趣的信息展现在用户面前.企业可以使用推荐系统挖掘潜在用户群体,从而提高销量.推荐系统作为用户和信息之间的桥梁,实现了信息消费者和信息生产者间的共赢.本论文对推荐系统中的相似度计算模型和推荐算法等关键技术进行了研究,所取得的主要研究成果为:1.对数值评分用模糊数表示方法进行了研究.针对数值评分表征用户偏好程度存在的不确定性问题,提出了运用模糊逻辑方法来获取用户喜好信息.通过定义模糊集和隶属函数,对评分值和评分偏差值进行模糊化,计算相应的模糊权重.对传统三种相似度计算模型加入模糊权重,并与未加模糊权重的相似度计算模型在协同过滤算法下比较,结果显示改进后的方法提高了推荐系统的准确性.2.对推荐系统的实时性进行了研究.针对用户的兴趣爱好随时间不断变化而导致推荐系统实时性问题,通过时间衰减函数,将评分时间信息加入到相似度计算模型中.考虑到用户数据集较大,对传统协同过滤算法引入聚类方法.最后结合模糊权重、时间权重,并在聚类协同过滤算法上,提出了FTKUBCF算法.通过实验验证,在预测准确率MAE和分类准确度F1上,该算法比传统的协同过滤算法有了明显提高.3.对基于二分图的加权资源分配算法进行了研究.针对传统的二分图资源分配算法在资源分配过程中,用户对所有的项目都具有相同的喜好度,依据顶点的度平均分配资源导致推荐结果不准确的问题.本文改进了传统资源分配算法,在资源分配过程中,依据用户的不同喜好程度对资源进行按比例分配,改进的WNBI算法提高了推荐系统的预测评分的准确性和分类准确性.