论文部分内容阅读
协同过滤推荐方法计算用户相似度时存在计算单一问题,并且随着用户数量增加计算量变大,同时也没有充分考虑用户偏好和用户对物品的标记信息对推荐结果的影响。为缓解以上问题,本文提出一种基于半监督混合聚类的协同过滤推荐方法,使用半监督聚类的方法确定相似用户,能够提高推荐的效果。主要内容如下:1.为有效融合有标记数据提高聚类精度,利用人工蜂群算法进行半监督聚类,提出了一种半监督人工蜂群聚类算法SSABC,设置权重参数来平衡标记数据与无标记数据的比重,并据此重构目标函数确定聚类中心点。使用自适应学习机制为权重参数赋值,同时结合聚类算法,提出了参数自适应学习的半监督混合聚类算法APL-SSHC。最后基于UCI数据集和MovieLens数据集,分析研究APL-SSHC算法的聚类效果,目标函数值逐步变小,F-Score值增大,将其与若干已有算法进行对比,以准确率为度量标准,实验表明APL-SSHC算法较其他算法的聚类效果更优,具有更高的准确率。2.基于APL-SSHC算法,提出一种基于半监督混合聚类的协同过滤推荐算法SSHC-CF。该算法首先利用APL-SSHC聚类算法对用户聚类,在目标用户所属类中确定其相似用户,多维度考虑用户的属性,更准确的找到目标用户的相似用户集合,克服计算用户相似度单一的问题,提高推荐算法的效率。3.考虑用户偏好对推荐结果的影响,提出一种基于半监督混合聚类与用户偏好的协同过滤推荐算法UP-SSHC-CF。将隐含狄利克雷分布(LDA)模型应用到用户、物品、标签的关系分析中,计算用户选择不同物品的偏好概率,利用APL-SSHC算法确定目标用户的相似用户集合,找到相似用户偏好概率较大的物品,形成推荐列表。基于MovieLens数据集,将SSHC-CF算法和UP-SSHC-CF算法与其他推荐算法进行对比,具有更高的准确率和F-measure值。