论文部分内容阅读
传统的新闻推荐算法已经不能够满足用户的浏览需求,特别是在如今的人工智能时代,如何提高用户的浏览体验成为一个研究热点,所以个性化新闻推荐算法应运而生。它和传统的新闻推荐算法相比,考虑了更多维的因素,这提高了推荐内容的可解释性,还有的算法引入了外部的知识图谱,这提高了推荐的多样性,但是存在下面两点因素给个性化新闻推荐算法造成困难,其一是新闻本身的特性,例如其数量大且内容覆盖广,更新快且时效性高;其二是在构建用户画像不容易统一,例如对不同用户的行为和兴趣,需要构建不同的用户画像。虽然目前主流的个性化新闻推荐算法取得了较好的推荐效果,但是大部分的算法忽略了新闻中的图片信息,而这些图片是具有潜在的价值。因为图片传达给用户的信息更为直观,更容易影响用户的阅读兴趣,所以本文提出了重构新闻标签的模型,并基于这些新标签提出了自适应标签算法,详细的研究内容概括如下:
(1)本文提出了融合新闻里的图片和文本来重构新闻标签的模型(MRNT)。考虑到新闻的原始标签数目少,并且很少包含新闻图片信息,又考虑到这些标签通常是由人工来编写完成的,仅能代表着部分人对该篇新闻的看法和理解。本文首先介绍了开源的图片识别器和词向量,其次是介绍神经网络和Word2Vec模型的基础知识,最后以原始的新闻标签为参考,去除掉从新闻图片和文本提取到的低相关性的特征,用余下的特征作为新闻的新标签,这些新标签是后文提出的标签相关性图和AT算法的基础。
(2)本文提出了一个关注用户短期兴趣的自适应标签算法(AT)。由于新闻的特性,导致用户的短期兴趣容易受到新闻内容的影响,如果用户的兴趣模型构建不好会降低用户的浏览体验,所以本文针对如何构建用户的短期兴趣模型提出了AT算法。该算法是通过用户的反馈,筛选出用户当前最感兴趣的标签。为了筛选出用户最感兴趣的标签,本文为用户当前感兴趣集合中的每个的标签进行打分,首先计算某标签在用户的浏览历史中的比重得分,然后计算该标签的热度得分,随后计算该标签在候选新闻中的比重得分,其次是计算该标签的延深得分。最后把前面四个的得分加起来就是该标签的最终得分,再选出得分最高的标签就是用户当前最感兴趣的标签。
(3)实验结果和分析。基于新闻推荐的性能评估标准(F1,AUC,MRR),验证了本文所提出的方法,在推荐条目较小的情况下,与其他基线相比具有较好的推荐效果。
(1)本文提出了融合新闻里的图片和文本来重构新闻标签的模型(MRNT)。考虑到新闻的原始标签数目少,并且很少包含新闻图片信息,又考虑到这些标签通常是由人工来编写完成的,仅能代表着部分人对该篇新闻的看法和理解。本文首先介绍了开源的图片识别器和词向量,其次是介绍神经网络和Word2Vec模型的基础知识,最后以原始的新闻标签为参考,去除掉从新闻图片和文本提取到的低相关性的特征,用余下的特征作为新闻的新标签,这些新标签是后文提出的标签相关性图和AT算法的基础。
(2)本文提出了一个关注用户短期兴趣的自适应标签算法(AT)。由于新闻的特性,导致用户的短期兴趣容易受到新闻内容的影响,如果用户的兴趣模型构建不好会降低用户的浏览体验,所以本文针对如何构建用户的短期兴趣模型提出了AT算法。该算法是通过用户的反馈,筛选出用户当前最感兴趣的标签。为了筛选出用户最感兴趣的标签,本文为用户当前感兴趣集合中的每个的标签进行打分,首先计算某标签在用户的浏览历史中的比重得分,然后计算该标签的热度得分,随后计算该标签在候选新闻中的比重得分,其次是计算该标签的延深得分。最后把前面四个的得分加起来就是该标签的最终得分,再选出得分最高的标签就是用户当前最感兴趣的标签。
(3)实验结果和分析。基于新闻推荐的性能评估标准(F1,AUC,MRR),验证了本文所提出的方法,在推荐条目较小的情况下,与其他基线相比具有较好的推荐效果。