论文部分内容阅读
将两种传统基于内存的协同过滤方法相结合,提出一种基于数据的GitHub项目个性化混合推荐方法.该方法不仅可动态地计算相似用户以保证推荐的个性化,且只用很小规模的相似用户便可得到与基于项目的方法相近的推荐质量;同时,该方法通过建立倒排表和利用K均值分类,在一定程度上解决了原方法在面对GitHub用户及项目数量级较大但交叉度较低的数据集时数据稀疏和冷启动问题.通过与传统方法进行对比实验,验证了该方法的有效性和优越性.