论文部分内容阅读
随着信息技术的发展,计算机网络深入到生活得各个方面,计算机网络上的应用纷繁多样。当互联网上拥有庞大的信息量与庞大的用户量的同时,信息与用户需求的匹配成为严峻的问题。庞大的信息量会使得用户获取特定信息的效率下降。个性化推荐的目标就是通过获取用户具体的需求,让每一位用户都能够高效地获取互联网上特定的信息。
要使用户信息获取更准确和高效,就需要解决用户兴趣描述不足的瓶颈问题。如何扩充用户兴趣的描述已成为信息检索的重要研究问题。现有工作主要包括相关反馈、隐式反馈与协同过滤。然而相关反馈不但干扰用户的使用,还存在第一步漏检的信息难以恢复的缺点;隐式反馈也有相关反馈中第一步漏检的信息在反馈后仍然难以恢复的缺陷,另外隐式反馈获得的信息往往有较大的噪音,影响系统的精度;协同过滤中,由于用户兴趣的描述本身很少,能用于判断两个用户兴趣相似程度的信息就很少,用这些很少的信息获取的相同兴趣用户组就会不准确。
随着web2.0的兴起,互联网从信息发布者与信息消费者分离的格局,转变为了信息发布者等于信息消费者的新格局,大量的用户开始在网络上发表日志、评论、图片、视频等信息。本文认为可以利用用户在互联网上发布的信息得到用户的发布兴趣,再来帮助用户在检索时对自己兴趣的描述。
本文主要工作在于提出通过使用用户的发布兴趣推测用户的获取兴趣,利用用户发布的信息来进行文章推荐的可行性进行研究。本文选择通过用户博客文章进行个性化推荐这个任务进行研究。首先,本文利用用户发表的博客文章,使用多种分类方法从一批博客文章中选取与用户需求相一致的文章,即进行个性化推荐,实验结果表明使用博客文章能够一定程度反映用户的兴趣所在。其次,本文尝试使用特征选择方法提高个性化推荐的准确度,实验表明可以通过特征选择提高推荐准确度。另外,本文还通过对博客文章与传统新闻文章推荐的对比实验,发现使用博客文章与使用传统新闻文章的不同之处,使用博客文章进行推荐的精度较低,且需要使用更多的特征,这些结果对未来利用博客文章辅助搜索的研究具有潜在意义。