论文部分内容阅读
常见的新闻推荐算法大抵分为基于内容的推荐和协同过滤推荐两类.为了能够更好地发挥不同算法的优点,增强推荐结果多样性的同时有效避免冷启动问题,本文决定采用以基于内容推荐为主,协同过滤推荐为辅的混合推荐算法.首先基于文本内容提炼关键词集,构建表示新闻文本的向量空间模型.其次一方面考虑用户的浏览时间、最后浏览时间与用户兴趣的变化关系用以构建用户现存兴趣模型;另一方面在相似用户的浏览记录中提取目标用户可能感兴趣的新闻文本构建用户潜在兴趣模型.然后综合考虑用户现存兴趣模型与用户潜在兴趣模型构造用户加权兴趣模型.最后将待推荐新闻按照发布时间小于当前时刻,发布时间大于当前时刻分为两类;前者与用户的现存兴趣模型进行相似度匹配,后者与用户的加权兴趣模型进行相似度匹配.真实数据表明本文所提出的用户兴趣模型比较符合用户的真实兴趣偏好,基于此模型的新闻推荐算法在多指标的表现上也优于常规算法。